Emne :Dataanalyse
Emne :Sentimentanalyse av produktanmeldelser
Mål :Målet med denne oppgaven er å utføre sentimentanalyse på produktanmeldelser for å fastslå vurderingen til produktet.
Instruksjoner :
1. Dataforberedelse :
– Samle et datasett med produktanmeldelser fra en passende kilde (f.eks. Amazon, Yelp).
- Rengjør dataene ved å fjerne dupliserte anmeldelser, håndtere manglende verdier og konvertere teksten til små bokstaver.
2. Utforskende dataanalyse :
- Utforsk dataene for å forstå dens egenskaper og distribusjon.
- Utfør grunnleggende statistikk, som frekvenstelling og ordskyer, for å identifisere vanlige ord og uttrykk som brukes i anmeldelsene.
3. Sentimentanalyse :
- Bruk et passende bibliotek eller verktøy for sentimentanalyse (f.eks. TextBlob, VADER eller spaCy) for å tildele sentimentpoeng til hver anmeldelse.
- Grupper anmeldelsene i positive, negative eller nøytrale kategorier basert på deres sentimentpoeng.
4. Funksjonsteknikk :
- Trekk ut relevante funksjoner fra anmeldelsene som kan bidra til følelsen. Disse kan inkludere ordfrekvenser, skilletegn eller andre NLP-relaterte funksjoner.
5. Machine Learning Model :
- Utvikle en overvåket maskinlæringsmodell for å klassifisere anmeldelsene som positive eller negative.
- Tren modellen på de merkede dataene og evaluer ytelsen ved hjelp av passende beregninger (f.eks. nøyaktighet, presisjon, tilbakekalling og F1-score).
6. Modelltolkning :
- Visualiser modellens spådommer ved hjelp av forvirringsmatriser eller andre relevante visualiseringer.
- Analyser feilklassifiserte anmeldelser for å identifisere forbedringsområder.
7. Rapportering :
- Skriv en rapport som oppsummerer funnene fra sentimentanalysen.
- Inkluder detaljer om dataforberedelse, utforskende dataanalyse, funksjonsteknikk, modelltrening og evalueringsresultater.
Innsending :
- Send inn følgende:
- En Jupyter Notebook eller Python-skript som inneholder koden og analysen din.
- En PDF-rapport som oppsummerer funnene.
Tidsfrist :
- Oppdraget skal leveres [dato].
- For sen innlevering vil medføre en straff på 10 % per dag.