Find Jobs
Hire Freelancers

Speedy high volume web page scraper

$750-1500 USD

Geschlossen
Veröffentlicht vor etwa 13 Jahren

$750-1500 USD

Bezahlt bei Lieferung
I have a software product that reads online text and creates a detailed profile (a profile is then compared to other profiles and recommendations can then be served). The profiling engine is a single-server Java application that is served off Tomcat. It has a REST API. Up till now, the profiles have reached my server via full text RSS feeds, or XML files (that I then create a custom parser for in Java). I now have a project where I will receive a high volume of urls (around 80,000 arriving during the course of the day) and will need to 'scrape' the text off these pages before passing this to the profiling engine. For this development operational speed is very important and so the 'scraper' needs to be fast acting in order to handle the perceived transaction volume but also accurate enough so that most of the page 'junk' does not affect adversely the profile that is made. Ideally the web scraper will take the page 'title' and 'article' text and use these for profiling. However, there will not be a standard format for these pages and so the web scraper needs to be fairly generic too. Get in contact if you feel you can achieve this but please you must have experience in this field!!
Projekt-ID: 1010422

Über das Projekt

11 Vorschläge
Remote Projekt
Aktiv vor 13 Jahren

Möchten Sie etwas Geld verdienen?

Vorteile einer Ausschreibung auf Freelancer

Legen Sie Ihr Budget und Ihren Zeitrahmen fest
Für Ihre Arbeit bezahlt werden
Skizzieren Sie Ihren Vorschlag
Sie können sich kostenlos anmelden und auf Aufträge bieten
11 Freelancer bieten im Durchschnitt $1.095 USD für diesen Auftrag
Avatar des Nutzers
Hello, Please check your inbox Thanks
$1.380 USD in 15 Tagen
4,9 (112 Bewertungen)
7,4
7,4
Avatar des Nutzers
$750 USD in 5 Tagen
4,9 (48 Bewertungen)
6,3
6,3
Avatar des Nutzers
Hello, we have a great experience in web scraping. A detailed experience information will be sent as PM. We can handle between 100-150K web sources (URLs) per day (have few servers doing this for years). Looking forward to hear from you! Regards Peter Long
$960 USD in 25 Tagen
5,0 (2 Bewertungen)
5,8
5,8
Avatar des Nutzers
Please check PMB
$1.200 USD in 15 Tagen
4,8 (10 Bewertungen)
5,6
5,6
Avatar des Nutzers
Hello Please check pmb
$1.500 USD in 12 Tagen
5,0 (1 Bewertung)
4,5
4,5
Avatar des Nutzers
can we discuss Reffer to pmb
$750 USD in 7 Tagen
4,9 (9 Bewertungen)
3,6
3,6
Avatar des Nutzers
I can help you really quickly! Check your inbox.
$750 USD in 3 Tagen
5,0 (3 Bewertungen)
3,5
3,5
Avatar des Nutzers
see PM for details
$1.500 USD in 20 Tagen
5,0 (6 Bewertungen)
3,5
3,5
Avatar des Nutzers
please see pm
$800 USD in 20 Tagen
0,0 (0 Bewertungen)
0,0
0,0
Avatar des Nutzers
I have long experience in J2EE and I have done many scrapers in java using htmlunit or jakarta commons.
$1.000 USD in 10 Tagen
0,0 (0 Bewertungen)
0,0
0,0

Über den Kunden

Flagge von UNITED KINGDOM
London, United Kingdom
0,0
0
Mitglied seit Apr. 4, 2011

Kundenüberprüfung

Danke! Wir haben Ihnen per E-Mail einen Link geschickt, über den Sie Ihr kostenloses Guthaben anfordern können.
Beim Senden Ihrer E-Mail ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
Registrierte Benutzer Veröffentlichte Jobs
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Vorschau wird geladen
Erlaubnis zur Geolokalisierung erteilt.
Ihre Anmeldesitzung ist abgelaufen und Sie wurden abgemeldet. Bitte melden Sie sich erneut an.