在当今的社交媒体时代,大量的数据被产生,这些数据反映了人们对政治事件、使用的产品或公司提供的服务的看法。通过挖掘和分析这些数据,可以深入了解人们对公司服务或使用产品的看法。例如,了解公众对某一产品或服务的推文情感可视化是自然语言处理(NLP)中的一个重要任务。如果像Paytm这样的公司想要了解人们对其产品的看法,它可以挖掘社交媒体数据,可视化结果数据,并深入了解人们对其服务的看法。同样,航空公司也可以通过同样的方式了解客户对他们服务的看法,并采取措施改善服务。构建图形化的仪表板可以简化事物,因为可以通过图表和数字的形式清晰地看到数据。交互式仪表板因其交互特性而使事情变得更容易,使能够看到许多参数。
有许多仪表板工具,如Powerbi、Tableau、Google Data Studio等。使用Python语言编写自己的仪表板可以降低成本并有效跟踪关键绩效指标(KPI)。Streamlit就是这样一个可以帮助创建交互式仪表板的库。在这个项目中,将使用Streamlit库创建一个交互式仪表板,以可视化美国航空公司客户的推文情感。
在这个应用中使用的数据集可以在这里找到。这是一个从2015年2月开始,通过抓取美国各大航空公司Twitter用户的推文创建的数据集。数据集中的推文情感已经被标记,将使用这些数据创建一个交互式仪表板,从中得出见解,并在Huggingface Spaces上部署。
Streamlit是一个开源的Python库,可以快速创建数据科学应用。还可以使用它来创建原型机器学习应用,使用创建的模型。这是一个非常有用的Python库,用于为任何应用创建Web界面。它还提供了一个免费的托管平台,称为Streamlit Share。可以创建应用的GitHub仓库,并直接将其连接到Streamlit Share平台。Streamlit Share负责一切,并为部署应用。
Hugging Face Spaces是托管机器学习应用并向社区展示的好方法。它是免费托管的,可以托管任意数量的应用。可以直接复制代码并创建一个app.py文件和requirements.txt文件。这个平台会自动为部署它,可以开始使用应用。将使用这个平台来部署应用。
首先,安装构建此应用所需的所有库:
pip install pandas
pip install numpy
pip install streamlit
pip install plotly
pip install wordcloud
pip install matplotlib
接下来,按照以下方式编写应用代码:
import streamlit as st
import pandas as pd
import numpy as np
import plotly.express as px
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
st.set_option('deprecation.showPyplotGlobalUse', False)
DATA_ = pd.read_csv("Tweets.csv")
st.title("美国航空公司推文情感分析")
st.sidebar.title("美国航空公司推文情感分析")
st.markdown("这个应用是一个Streamlit仪表板,用于分析推文的情感")
st.sidebar.markdown("这个应用是一个Streamlit仪表板,用于分析推文的情感")
# 省略部分代码以节省篇幅...
streamlit
plotly
wordcloud
matplotlib