The-Natural-Language-Processing-Workshop/Chapter08/data/sentiment_labelled_sentences at master · PacktWorkshops/The-Natural-Language-Processing-Workshop

History

Name		Name	Last commit message	Last commit date
parent directory ..
amazon_cells_labelled.txt		amazon_cells_labelled.txt
imdb_labelled.txt		imdb_labelled.txt
readme.txt		readme.txt
yelp_labelled.txt		yelp_labelled.txt

readme.txt

This dataset was created for the Paper 'From Group to Individual Labels using Deep Features', Kotzias et. al,. KDD 2015
Please cite the paper if you want to use it :)

It contains sentences labelled with positive or negative sentiment, extracted from reviews of products, movies, and restaurants

=======
Format:
=======
sentence \t score \n


=======
Details:
=======
Score is either 1 (for positive) or 0 (for negative)	
The sentences come from three different websites/fields:

imdb.com
amazon.com
yelp.com

For each website, there exist 500 positive and 500 negative sentences. Those were selected randomly for larger datasets of reviews. 
We attempted to select sentences that have a clearly positive or negative connotaton, the goal was for no neutral sentences to be selected.



For the full datasets look:

imdb: Maas et. al., 2011 'Learning word vectors for sentiment analysis'
amazon: McAuley et. al., 2013 'Hidden factors and hidden topics: Understanding rating dimensions with review text'
yelp: Yelp dataset challenge http://www.yelp.com/dataset_challenge

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

sentiment_labelled_sentences

sentiment_labelled_sentences

amazon_cells_labelled.txt

amazon_cells_labelled.txt

imdb_labelled.txt

imdb_labelled.txt

readme.txt

readme.txt

yelp_labelled.txt

yelp_labelled.txt

readme.txt

Files

sentiment_labelled_sentences

Directory actions

More options

Directory actions

More options

Latest commit

History

sentiment_labelled_sentences

Folders and files

parent directory