0% found this document useful (0 votes)

138 views30 pages

Analyzing Social Media Data in Python Chapter2

This document discusses analyzing social media data in Python. It covers processing Twitter text by accessing the text within tweets and extended tweets. It also discusses counting words to analyze frequency, treating tweets as time series data by converting timestamps and tracking keyword frequencies over time. Finally, it discusses sentiment analysis using VADER to assign sentiment scores to tweets and analyzing sentiment toward topics over time.

Uploaded by

Fgpeqw

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

138 views30 pages

Analyzing Social Media Data in Python Chapter2

Uploaded by

Fgpeqw

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 30

DataCamp Analyzing Social Media Data in Python

ANALYZING SOCIAL MEDIA DATA IN PYTHON

Processing Twitter Text

Alex Hanna
Computational Social Scientist
DataCamp Analyzing Social Media Data in Python

Text in Twitter JSON

tweet_json = open('tweet-example.json', 'r').read()
tweet = json.loads(tweet_json)
tweet['text']
DataCamp Analyzing Social Media Data in Python

More than 140 characters

tweet['extended_tweet']['full_text']
DataCamp Analyzing Social Media Data in Python

Retweets and quoted tweets

tweet['quoted_status']['extended_tweet']['full_text']
DataCamp Analyzing Social Media Data in Python

Textual user information

tweet['user']['description']
tweet['user']['location']
DataCamp Analyzing Social Media Data in Python

Flattening Twitter JSON

extended_tweet['extended_tweet-full_text'] =
extended_tweet['extended_tweet']['full_text']
DataCamp Analyzing Social Media Data in Python

Flattening Twitter JSON

tweet_list = []
with open('all_tweets.json', 'r') as fh:
tweets_json = fh.read().split("\n")

for tweet in tweets_json:

tweet_obj = json.loads(tweet)

if 'extended_tweet' in tweet_obj:
tweet_obj['extended_tweet-full_text'] =
tweet_obj['extended_tweet']['full_text']
...

tweet_list.append(tweet)

tweets = pd.DataFrame(tweet_list)
DataCamp Analyzing Social Media Data in Python

ANALYZING SOCIAL MEDIA DATA IN PYTHON

Let's practice!
DataCamp Analyzing Social Media Data in Python

ANALYZING SOCIAL MEDIA DATA IN PYTHON

Counting words

Alex Hanna
Computational Social Scientist
DataCamp Analyzing Social Media Data in Python

Why count words?

Basic step for automation of text analysis
Can tell us how many times a relevant keyword is mentioned in documents in
comparison to others
In exercises: #rstats vs #python
DataCamp Analyzing Social Media Data in Python

Counting with str.contains

str.contains

pandas Series string method

Returns boolean Series

case = False - Case insensitive search

DataCamp Analyzing Social Media Data in Python

Companies dataset
> import pandas as pd

> tweets = pd.DataFrame(flatten_tweets(companies_json))

> apple = tweets['text'].str.contains('apple', case = False)

> print(np.sum(apple) / tweets.shape[0])

0.112
DataCamp Analyzing Social Media Data in Python

Counting in multiple text fields

> apple = tweets['text'].str.contains('apple', case = False)

> for column in ['extended_tweet-full_text',

'retweeted_status-text',
'retweeted_status-extended_tweet-full_text']:
apple = apple | tweets[column].str.contains('apple', case = False)

> print(np.sum(apple) / tweets.shape[0])

0.12866666666666668
DataCamp Analyzing Social Media Data in Python

ANALYZING SOCIAL MEDIA DATA IN PYTHON

Let's practice!
DataCamp Analyzing Social Media Data in Python

ANALYZING SOCIAL MEDIA DATA IN PYTHON

Time Series

Alex Hanna
Computational Social Scientist
DataCamp Analyzing Social Media Data in Python

Time series data

sum person
date
2012-10-23 01:00:00 314 Obama
2012-10-23 01:01:00 369 Obama
2012-10-23 01:02:00 527 Obama
2012-10-23 01:03:00 589 Obama
2012-10-23 01:04:00 501 Obama
...
DataCamp Analyzing Social Media Data in Python

Converting datetimes
> print(tweets['created_at'])

0 Sat Jan 27 18:36:21 +0000 2018

1 Sat Jan 27 18:24:02 +0000 2018
2 Sat Jan 27 18:09:14 +0000 2018
...

> tweets['created_at'] = pd.to_datetime(tweets['created_at'])

> print(tweets['created_at'])

0 2018-01-27 18:36:21
1 2018-01-27 18:24:02
2 2018-01-27 18:09:14
...

> tweets = tweets.set_index('created_at')

DataCamp Analyzing Social Media Data in Python

Keywords as time series metrics

> tweets['google'] = check_word_in_tweet('google', tweets)

> print(tweets['google'])

created_at
2018-01-27 18:36:21 False
2018-01-27 18:24:02 False
2018-01-27 18:30:12 False
2018-01-27 18:12:37 True
2018-01-27 18:11:06 True
....

> print(np.sum(tweets['google']))

247
DataCamp Analyzing Social Media Data in Python

Generating keyword means

> mean_google = tweets['google'].resample('1 min').mean()

> print(mean_google)

created_at
2018-01-27 18:07:00 0.085106
2018-01-27 18:08:00 0.285714
2018-01-27 18:09:00 0.161290
2018-01-27 18:10:00 0.222222
2018-01-27 18:11:00 0.169231
DataCamp Analyzing Social Media Data in Python

Plotting keyword means

import matplotlib.pyplot as plt

plt.plot(means_facebook.index.minute,
means_facebook, color = 'blue')
plt.plot(means_google.index.minute,
means_google, color = 'green')
plt.xlabel('Minute')
plt.ylabel('Frequency')
plt.title('Company mentions')
plt.legend(('facebook', 'google'))
plt.show()
DataCamp Analyzing Social Media Data in Python

ANALYZING SOCIAL MEDIA DATA IN PYTHON

Let's practice!
DataCamp Analyzing Social Media Data in Python

ANALYZING SOCIAL MEDIA DATA IN PYTHON

Sentiment Analysis

Alex Hanna
Computational Social Scientist
DataCamp Analyzing Social Media Data in Python

Understanding sentiment analysis

Method
Counting positive/negative words in the document
Assessing positivity/negativity of the whole document
Uses
Analyzing reactions to a company, product, politician, or policy
DataCamp Analyzing Social Media Data in Python

Sentiment analysis tools

VADER SentimentIntensityAnalyzer()

Part of Natural Language Toolkit (nltk)

Good for short texts like tweets

Measures sentiment of particular words (e.g. angry, happy)
Also considers sentiment of emoji ( ) and capitalization (Nice vs NICE)
DataCamp Analyzing Social Media Data in Python

Implementing sentiment analysis

from nltk.sentiment.vader import SentimentIntensityAnalyzer

sid = SentimentIntensityAnalyzer()

sentiment_scores = tweets['text'].apply(sid.polarity_scores)
DataCamp Analyzing Social Media Data in Python

Interpreting sentiment scores

Reading tweets as part of the process
Does it have face validity? (i.e. does this match my idea of what it means to be
positive or negative?)
DataCamp Analyzing Social Media Data in Python

Interpreting sentiment scores

tweet1 = 'RT @jeffrey_heer: Thanks for inviting me, and thanks for the
lovely visualization of the talk! ...'
print(sid.polarity_scores(tweet1))

{'neg': 0.0, 'neu': 0.496, 'pos': 0.504, 'compound': 0.9041}

tweet2 = 'i am having problems with google play music'

print(sid.polarity_scores(tweet2)

{'neg': 0.267, 'neu': 0.495, 'pos': 0.238, 'compound': -0.0772}

DataCamp Analyzing Social Media Data in Python

Generating sentiment averages

sentiment = sentiment_scores.apply(lambda x: x['compound'])

sentiment_fb = sentiment[check_word_in_tweet('facebook', tweets)]

.resample('1 min').mean()
sentiment_gg = sentiment[check_word_in_tweet('google', tweets)]
.resample('1 min').mean()
DataCamp Analyzing Social Media Data in Python

Plotting sentiment scores

plt.plot(sentiment_fb.index.minute,
sentiment_fb, color = 'blue')
plt.plot(sentiment_g.index.minute,
sentiment_gg, color = 'green')

plt.xlabel('Minute')
plt.ylabel('Sentiment')
plt.title('Sentiment of companies')
plt.legend(('Facebook', 'Google'))
plt.show()
DataCamp Analyzing Social Media Data in Python

ANALYZING SOCIAL MEDIA DATA IN PYTHON

Let's practice!

Credit Risk Modeling in Python Chapter3
No ratings yet
Credit Risk Modeling in Python Chapter3
35 pages
10 Great Dates To Energize Your Marriage
100% (1)
10 Great Dates To Energize Your Marriage
29 pages
Sentiment Analysis of Twitter Data My
75% (4)
Sentiment Analysis of Twitter Data My
14 pages
Introduction To Data Visualization With Seaborn Chapter3
100% (1)
Introduction To Data Visualization With Seaborn Chapter3
32 pages
Designing Machine Learning Workflows in Python Chapter2
No ratings yet
Designing Machine Learning Workflows in Python Chapter2
39 pages
Manager's Guide To Harnessing Technology
No ratings yet
Manager's Guide To Harnessing Technology
12 pages
Analyzing Social Media Data in Python Chapter1
No ratings yet
Analyzing Social Media Data in Python Chapter1
21 pages
2.1 Analysing Social Media in Python
No ratings yet
2.1 Analysing Social Media in Python
21 pages
Part C - Assignment No. 2 Mini-Project On Twitter
No ratings yet
Part C - Assignment No. 2 Mini-Project On Twitter
7 pages
Analyzing Social Media Data in Python Chapter4
No ratings yet
Analyzing Social Media Data in Python Chapter4
20 pages
Twitter Sentiment Analysis
No ratings yet
Twitter Sentiment Analysis
13 pages
Part C Assignment No 2 Mini Project On Twitter 1
No ratings yet
Part C Assignment No 2 Mini Project On Twitter 1
9 pages
Part C - Assignment No. 2 Mini-Project On Twitter
No ratings yet
Part C - Assignment No. 2 Mini-Project On Twitter
7 pages
Chandru Lab 3
No ratings yet
Chandru Lab 3
7 pages
SMA4
No ratings yet
SMA4
5 pages
IR Case Study Final Presentation
No ratings yet
IR Case Study Final Presentation
12 pages
Sentiment Analysis On Twitter Data Using Machine Learning Algorithms in Python
No ratings yet
Sentiment Analysis On Twitter Data Using Machine Learning Algorithms in Python
15 pages
Implementation of Sentiment Analysis On Twitter Data
No ratings yet
Implementation of Sentiment Analysis On Twitter Data
6 pages
Twitter Sentiment Analysis Research Paper
No ratings yet
Twitter Sentiment Analysis Research Paper
5 pages
Social Media Sentiment
No ratings yet
Social Media Sentiment
8 pages
Sentiment Analysis On User-Generated Tweets
No ratings yet
Sentiment Analysis On User-Generated Tweets
15 pages
Social Media Se
No ratings yet
Social Media Se
3 pages
Internship-Review Hiranmai 045
No ratings yet
Internship-Review Hiranmai 045
20 pages
Twitter Sentimental Analysis: © APR 2021 - IRE Journals - Volume 4 Issue 10 - ISSN: 2456-8880
No ratings yet
Twitter Sentimental Analysis: © APR 2021 - IRE Journals - Volume 4 Issue 10 - ISSN: 2456-8880
5 pages
Template For The First Slide of PPT Presentation1
No ratings yet
Template For The First Slide of PPT Presentation1
18 pages
Twitter Sentiment Analysis System
No ratings yet
Twitter Sentiment Analysis System
5 pages
Tweet-Sentiment-Extraction - Exploratory Data Analysis
No ratings yet
Tweet-Sentiment-Extraction - Exploratory Data Analysis
11 pages
Social Data Analytics
No ratings yet
Social Data Analytics
2 pages
Vaibhav DSBDA Project
No ratings yet
Vaibhav DSBDA Project
16 pages
Twitter Sentiment Analysis For Product Review
No ratings yet
Twitter Sentiment Analysis For Product Review
19 pages
Twitter Sentiment Analysis Using Python
No ratings yet
Twitter Sentiment Analysis Using Python
21 pages
Senti bp1
No ratings yet
Senti bp1
2 pages
EXP5
No ratings yet
EXP5
15 pages
Sentiment Analysis On Twitter Data Using Machine Learning Algorithms in Python
No ratings yet
Sentiment Analysis On Twitter Data Using Machine Learning Algorithms in Python
14 pages
Sentiment Analysis
No ratings yet
Sentiment Analysis
3 pages
Twitter Sentiment Analysis
No ratings yet
Twitter Sentiment Analysis
7 pages
ProjectFinalReport 2copies
No ratings yet
ProjectFinalReport 2copies
26 pages
Fin Irjmets1715854730
No ratings yet
Fin Irjmets1715854730
8 pages
FML Project Report
No ratings yet
FML Project Report
18 pages
Twitter Sentiment Analysis Using Deep Learning
No ratings yet
Twitter Sentiment Analysis Using Deep Learning
17 pages
Data Science Project
No ratings yet
Data Science Project
34 pages
Review and Analysis of Emotion Detection from Tweets using Twitter Datasets
No ratings yet
Review and Analysis of Emotion Detection from Tweets using Twitter Datasets
9 pages
Mining the Social Web Analyzing Data from Facebook Twitter LinkedIn and Other Social Media Sites 1st Edition Matthew A. Russell digital download
No ratings yet
Mining the Social Web Analyzing Data from Facebook Twitter LinkedIn and Other Social Media Sites 1st Edition Matthew A. Russell digital download
94 pages
Sentiment Analysis of Twitter Data: Radhi D. Desai
No ratings yet
Sentiment Analysis of Twitter Data: Radhi D. Desai
4 pages
Sentiment Analysis of Social Media With Python - by Haaya Naushan - Towards Data Science
No ratings yet
Sentiment Analysis of Social Media With Python - by Haaya Naushan - Towards Data Science
9 pages
Hate Speech Detection
No ratings yet
Hate Speech Detection
6 pages
Dsbda
No ratings yet
Dsbda
12 pages
Prototype 1
No ratings yet
Prototype 1
10 pages
Introduction
No ratings yet
Introduction
27 pages
Fin Ijprems1714118825
No ratings yet
Fin Ijprems1714118825
6 pages
1python Full-1 Project
No ratings yet
1python Full-1 Project
21 pages
Toxic Comment Classification System Using Deep Lea
No ratings yet
Toxic Comment Classification System Using Deep Lea
6 pages
Design Review
No ratings yet
Design Review
16 pages
Machine Learning For Sentiment Analysis of Twitter Data
No ratings yet
Machine Learning For Sentiment Analysis of Twitter Data
9 pages
Twitter Sentiment Analysis Dss
No ratings yet
Twitter Sentiment Analysis Dss
14 pages
Review Analysis Using R Software: Team Members
No ratings yet
Review Analysis Using R Software: Team Members
10 pages
INDEXReport Ayush
No ratings yet
INDEXReport Ayush
38 pages
Clean and Analyse Social Media Data
No ratings yet
Clean and Analyse Social Media Data
3 pages
Lab 15 Assignment by Ankit
No ratings yet
Lab 15 Assignment by Ankit
4 pages
Twitter Sentiment Analysis
No ratings yet
Twitter Sentiment Analysis
4 pages
Fake News Synopsis
No ratings yet
Fake News Synopsis
10 pages
Twitter Sentiment Analysis (NLP) : This Photo CC By-Nc
100% (1)
Twitter Sentiment Analysis (NLP) : This Photo CC By-Nc
18 pages
Sentiment Analysis On Twitter in R
No ratings yet
Sentiment Analysis On Twitter in R
3 pages
Authors:: Apoorv Agarwal Boyi Xie Ilia Vovsha Owen Rambow Rebecca Passonneau
No ratings yet
Authors:: Apoorv Agarwal Boyi Xie Ilia Vovsha Owen Rambow Rebecca Passonneau
9 pages
Data Science with R: Beginner to Expert
From Everand
Data Science with R: Beginner to Expert
Narayana Nemani
No ratings yet
Spoken Language Processing in Python Chapter4
No ratings yet
Spoken Language Processing in Python Chapter4
46 pages
Spoken Language Processing in Python Chapter1
No ratings yet
Spoken Language Processing in Python Chapter1
17 pages
Spoken Language Processing in Python Chapter3
No ratings yet
Spoken Language Processing in Python Chapter3
26 pages
Spoken Language Processing in Python Chapter2
No ratings yet
Spoken Language Processing in Python Chapter2
23 pages
Chapter3 PDF
No ratings yet
Chapter3 PDF
36 pages
Introduction To Data Visualization With Matplotlib Chapter2
No ratings yet
Introduction To Data Visualization With Matplotlib Chapter2
27 pages
Introduction To Data Visualization With Seaborn Chapter2
No ratings yet
Introduction To Data Visualization With Seaborn Chapter2
38 pages
Designing Machine Learning Workflows in Python Chapter4
No ratings yet
Designing Machine Learning Workflows in Python Chapter4
38 pages
Preparing Your Gures To Share With Others: Ariel Rokem
No ratings yet
Preparing Your Gures To Share With Others: Ariel Rokem
35 pages
Introduction To Data Visualization With Matplotlib: Ariel Rokem
No ratings yet
Introduction To Data Visualization With Matplotlib: Ariel Rokem
30 pages
Introduction To Data Visualization With Seaborn Chapter1
No ratings yet
Introduction To Data Visualization With Seaborn Chapter1
26 pages
Changing Plot Style and Color: Erin Case
No ratings yet
Changing Plot Style and Color: Erin Case
54 pages
Credit Risk Modeling in Python Chapter4
100% (1)
Credit Risk Modeling in Python Chapter4
35 pages
Customer Segmentation in Python Chapter4
No ratings yet
Customer Segmentation in Python Chapter4
37 pages
Designing Machine Learning Workflows in Python Chapter3
No ratings yet
Designing Machine Learning Workflows in Python Chapter3
42 pages
Designing Machine Learning Workflows in Python Chapter1
No ratings yet
Designing Machine Learning Workflows in Python Chapter1
32 pages
Customer Segmentation in Python Chapter3
No ratings yet
Customer Segmentation in Python Chapter3
25 pages
Cleaning Data With PySpark Chapter4
No ratings yet
Cleaning Data With PySpark Chapter4
23 pages
Cleaning Data With PySpark Chapter2
100% (1)
Cleaning Data With PySpark Chapter2
25 pages
Building Chatbots in Python Chapter2 PDF
No ratings yet
Building Chatbots in Python Chapter2 PDF
41 pages
Analyzing IoT Data in Python Chapter2
No ratings yet
Analyzing IoT Data in Python Chapter2
35 pages
Cleaning Data With PySpark Chapter1
0% (1)
Cleaning Data With PySpark Chapter1
20 pages
Analyzing IoT Data in Python Chapter4
No ratings yet
Analyzing IoT Data in Python Chapter4
34 pages
Building Chatbots in Python Chapter4
No ratings yet
Building Chatbots in Python Chapter4
20 pages
Cleaning Data With PySpark Chapter3
No ratings yet
Cleaning Data With PySpark Chapter3
25 pages
Analyzing IoT Data in Python Chapter1
100% (1)
Analyzing IoT Data in Python Chapter1
27 pages
Analyzing IoT Data in Python Chapter3
No ratings yet
Analyzing IoT Data in Python Chapter3
30 pages
MA3151 Matrices and Calculus Reg 2021 Notes
No ratings yet
MA3151 Matrices and Calculus Reg 2021 Notes
207 pages
Written Article Analysis Elc501 (Nur Anis Wahidah & Nurul Aida Izzaty)
No ratings yet
Written Article Analysis Elc501 (Nur Anis Wahidah & Nurul Aida Izzaty)
6 pages
Dear Cross Country Athletes and Parents/Guardians
No ratings yet
Dear Cross Country Athletes and Parents/Guardians
14 pages
Technological Revolution
No ratings yet
Technological Revolution
4 pages
Lesson Plan - B2 First For Schools Speaking Parts 3 and 4
No ratings yet
Lesson Plan - B2 First For Schools Speaking Parts 3 and 4
15 pages
Admissibility of Electronic Evidence Under Act
No ratings yet
Admissibility of Electronic Evidence Under Act
5 pages
Ultimate Guide To Promoting Your Local Business
No ratings yet
Ultimate Guide To Promoting Your Local Business
29 pages
Recruitment and Selection
100% (2)
Recruitment and Selection
46 pages
Ugc Net Paper 1 Pyq English Sample
No ratings yet
Ugc Net Paper 1 Pyq English Sample
19 pages
Guraya 2021
No ratings yet
Guraya 2021
12 pages
Media and Information Opportunities Challenges: Economics
No ratings yet
Media and Information Opportunities Challenges: Economics
3 pages
The Effect of Digital Marketing On Purchasing Decisions - A Case Study in Jordan
100% (1)
The Effect of Digital Marketing On Purchasing Decisions - A Case Study in Jordan
9 pages
Reflection Memo
No ratings yet
Reflection Memo
4 pages
New Xhamster Xxx Hot Xnxx Xvideo 609463
No ratings yet
New Xhamster Xxx Hot Xnxx Xvideo 609463
3 pages
CNF11 - 12 Q2 0504M - SG - Revising A Creative Nonfiction Text Based On A Critique
No ratings yet
CNF11 - 12 Q2 0504M - SG - Revising A Creative Nonfiction Text Based On A Critique
22 pages
43-62 General Athlete PDF
No ratings yet
43-62 General Athlete PDF
20 pages
Resume - Maurell Raisa Putri
0% (1)
Resume - Maurell Raisa Putri
2 pages
Marked Paragraphs
No ratings yet
Marked Paragraphs
179 pages
The Health and Wellness Entrepreneur's Business Toolkit - V4
No ratings yet
The Health and Wellness Entrepreneur's Business Toolkit - V4
59 pages
Year 9 Autumn Term Homework Booklet 2023 2024
No ratings yet
Year 9 Autumn Term Homework Booklet 2023 2024
48 pages
Ali Express Inb
No ratings yet
Ali Express Inb
14 pages
Instagram Tags Homework
100% (1)
Instagram Tags Homework
7 pages
Citizen Manual FOR National Cybercrime Reporting Portal: Ministry of Home Affairs
No ratings yet
Citizen Manual FOR National Cybercrime Reporting Portal: Ministry of Home Affairs
92 pages
BP Plan
No ratings yet
BP Plan
14 pages
Zomato Case Study
No ratings yet
Zomato Case Study
17 pages
Report English
No ratings yet
Report English
5 pages
3i Manuscript
No ratings yet
3i Manuscript
78 pages
Name-Yuvraj Singh Yadav
No ratings yet
Name-Yuvraj Singh Yadav
11 pages