Find Jobs
Hire Freelancers

Developing a Text Information Retrieval System "project for college"

$30-250 USD

Abgeschlossen
Veröffentlicht vor etwa 9 Jahren

$30-250 USD

Bezahlt bei Lieferung
Introduction Information retrieval is the process of extracting useful information from data. In the current era, text constitutes an important form of data. This includes web pages, emails, SMS messages and several other text documents types. Text documents need to be represented in an appropriate format (usually in the form of vectors of numbers) in order to be used for further processing. Once properly repre- sented, text documents can be used for various tasks such as classi cation, for instance, deciding whether an email is a spam, or search, for example, deciding whether two web pages have similar content. Before representing documents as numbers, however, they must be preprocessed. Text preprocessing is the tasks of removing unnecessary information from the text. This is achieved through several steps, which are summarized hereafter 1. Initial preprocessing: The goal of this step is to "clean up" the document and prepare it for the remaining tasks. The di erent tasks conducted in this step are: (a) Replace tabulation, return and new line by space. (b) Remove all non-letter characters: turn punctuation, numbers, etc. into spaces. (c) Switch all letters to lowercase. (d) Substitute multiple spaces by a single space. (e) Remove words that are shorter than 3 characters long. For example, remove "an" but keep "him". 2. Stop words removal: Some words such as "a", "the", "and" are very common in English and should be removed from the text in order to only leave useful words. This task is simply done by removing any word that appears in a prede ned list of stop words. 3. Stemming: The same word can take di erent forms depending on its role and position in the sentence.
Projekt-ID: 7372961

Über das Projekt

6 Vorschläge
Remote Projekt
Aktiv vor 9 Jahren

Möchten Sie etwas Geld verdienen?

Vorteile einer Ausschreibung auf Freelancer

Legen Sie Ihr Budget und Ihren Zeitrahmen fest
Für Ihre Arbeit bezahlt werden
Skizzieren Sie Ihren Vorschlag
Sie können sich kostenlos anmelden und auf Aufträge bieten
Vergeben an:
Avatar des Nutzers
Hello I am Java expert and interested in this project. I have reviewed your requirements and confident to handle this project perfectly. Please communicate to discuss further. Regards Anshu
$54 USD in 1 Tag
4,7 (319 Bewertungen)
7,2
7,2
6 Freelancer bieten im Durchschnitt $71 USD für diesen Auftrag
Avatar des Nutzers
I have done similar projects before so I think I could help.
$60 USD in 1 Tag
4,9 (48 Bewertungen)
4,5
4,5
Avatar des Nutzers
Greetings! I have passed the Information retrieval course with 4.0 and I have already completed a similar task as assignment using java lucene library. If you are allowed to use a java library, I can complete this task quickly and efficiently. Do let me know, thank you.
$55 USD in 3 Tagen
5,0 (4 Bewertungen)
2,6
2,6
Avatar des Nutzers
3 years of hands on experience in java. Timely delivery and effiency is guaranteed. Let me do this fo you.
$35 USD in 3 Tagen
0,0 (0 Bewertungen)
0,0
0,0
Avatar des Nutzers
Hello. This is not really compicated task. I can do it just because I need to improve my freelancer reputation. So if you are interested in a quick solution - let me know.
$155 USD in 3 Tagen
0,0 (0 Bewertungen)
0,0
0,0

Über den Kunden

Flagge von SAUDI ARABIA
alriyadh, Saudi Arabia
5,0
2
Mitglied seit März 23, 2015

Kundenüberprüfung

Danke! Wir haben Ihnen per E-Mail einen Link geschickt, über den Sie Ihr kostenloses Guthaben anfordern können.
Beim Senden Ihrer E-Mail ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
Registrierte Benutzer Veröffentlichte Jobs
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Vorschau wird geladen
Erlaubnis zur Geolokalisierung erteilt.
Ihre Anmeldesitzung ist abgelaufen und Sie wurden abgemeldet. Bitte melden Sie sich erneut an.