Geschlossen

Data analysis

Dieses Projekt hat 15 Angebote von talentierten Freelancern mit einem durchschnittlichen Angebotspreis von $193 USD erhalten.

Erhalten Sie kostenlose Angebote für ein Projekt wie dieses
Arbeitgeber arbeiten
Projektbudget
$30 - $250 USD
Angebotsanzahl
15
Projektbeschreibung

Deadline: Thursday 10/ Nov/2016

Using python, pandas, numpy and scikit learn.

For visualizations, you will not need anything more complex than scatter-plots, histograms or line plots. You will provide a single ipython notebook that contains the code for all the answers. Use a separate tab for each question. For each task, also write your appropriate answers in a .txt, .doc or .pdf and submit this along with your code.

1. I have provided you with a dataset called data1. It contains a train and test dataset. Use a suitable method to predict the “Value” given the features (there are 100 features) (there are a number of redundancies in the features). Evaluate and present your results using an appropriate error measure.

2. I have provided you with two datasets in data2.zip. For each dataset:

a. Analyze the data using an appropriate visualization

b. Use an appropriate method to cluster similar data-points together. Justify why you

picked the specific method for each dataset.

c. Output the clustered points using an appropriate visualization.

Möchten Sie Geld verdienen?

  • Legen Sie Ihr Budget und Ihren Zeitraum fest
  • Skizzieren Sie Ihr Angebot
  • Bekommen Sie Geld für Ihre Arbeit

Heuern Sie Freelancer an, die auch auf dieses Projekt geboten haben

    • Forbes
    • The New York Times
    • Time
    • Wall Street Journal
    • Times Online