通过社交媒体实现的这种双向交流为很多公司企业提供了宝贵机会,能够让他们与终端用户直接沟通。
关键词提取
首先我们需要在初级输入(primary input)中输入种类条目,找到数据提取需要的不同关键词。举例来说,对高价的组合式橱柜,我们需要知道不同品牌的数量、名称和特点,现在流行的款式等等。同时还需要剔除一些干扰词来去掉无关信息。如果我们仅仅使用“橱柜”这个关键词,就能找到“@XXX – 竞争激烈啊! Brand-YYY @Kitchen_Art #生活方式”,这样的信息就是和组合橱柜无关了。
数据提取和数据筛选
一旦关键词列表确定了,我们就需要确定合理的查询模式来抓取有效内容。为了避免上面提到的问题,我们在输入关键词的同时也要剔除干扰词。当然我们还需要筛选正确的信息源,对组合橱柜来说,可以找Houzz.com论坛等。
将定性数据转化为定量数据:接下来我们需要通过文本挖掘和自然语言处理技术来将定性数据转化为定量数据。
演示如下图:
之后还需要通过“测试&学习”方式对上表进行调整,调整后如图:
购买意向&基本分类创建&调整:分析购买意向时,我们需要以样本数据扫描为基础,创建一个初级分类。
情感分析
分析语气来判断公众心态,看他们对某个产品是持积极、消极还是中立态度。
这种包含了预测模型和习惯分类法的基于Naïve Bayes分类器的分类方法能够有效提高准确度(>80%)。
语气计算流程如下:
文本挖掘:从每条动态中提取主要概念、创建变量并记录100个左右的概念。
人工情感分类:随意提取10%样本或至少5000个数据点、人工对这些数据进行分类。
预测模型:利用决策树、神经网络,SVM等算法,学习样本数据分类,从而确定分类规则。
习惯规则:基于Business Logic、 Naïve Bayes分类器等条件概率算法,建立习惯规则,提高语气情感分析的准确性。
运用分类规则:将预测算法规则和习惯规则应用到整个数据集,获取每个信息点的语气情感信息。
开发潜在客户
购买意向分析和语气分析结束后,我们可以将内容分为:
高可能性客户
中等可能性客户
低可能性客户
然后着重分析高可能性和中等可能性用户的需求和痛点,然后制定沟通策略来对他们进行重点营销。
解决方案运作模式
每一个新的数据产生以后,这个数据就将根据现有规则被分到相应的分类条目中。每三个月应该对这些规则进行再验证。
社交媒体分析工具
目前可供市场分析师使用的社交媒体分析工具非常多,如Radian6、Sysomos、Poly Analyst (Megaputer)、HootSuite等等。这些工具可以用来分析多个渠道的数据,也有专门用于分析某个网站数据的分析工具,如Twitter分析工具,Facebook分析工具等。所有这些分析工具都能用于将定性数据转化成数据表格,可用于社交媒体监测。
还有一些使用感较好的统计工具,如R语言、SPSS文本挖掘器、SAS统计分析系统,能够用于预测建模等高级分析过程。Naive Bayes分类器可用于提高情感分析的准确度。