用户消费能力研究-数控滚圆机滚弧机折弯机张家
微博,作为社交网络的成员之一,以易操作、传播快等特点成为社交网络中的用户发表观点,分享新鲜事的一个重要平台。无论是微博用户所发微博文本信息,还是用户公布在社交媒体中的属性信息,都可能透露出商业中用户的重要属性——消费能力。研究用户的消费能力能够帮助企业针对每个用户的消费能力制定更加有效的商业策略,增大商家投放广告的效率。如今,基于微博的用户画像工作、微博中消费意图识别和商品推荐问题已经成为短文本自然语言处理领域的研究热点。然而,已有工作主要是对用户未公开的基本属性进行预测,或基于微博文本对用户的消费意图进行识别,很少有工作研究微博用户的消费能力。因此,本文主要对微博用户所发微博文本和属性信息与用户的消费能力之间的关系进行研究。首先通过用户链指的方式获取到微博用户的京东账号信息,以京东账号会员等级将消费能力分为高、中、低3个等级。然后将微博文本向量化处理后与用户属性联合在一起,经过特征选择后作为输入训练模型,预测用户的消费能力。 3种特征选择方法撷选出来的前10000个词和前50000个词分别作为特征项,作为模型训练的输入,进行对比实验。在分类器的选择上,
本文由公司网站网站采 转摘采集转载中国知网整理! http://www.kuoguanji168.com/选择了支持向量机(。用户消费能力研究-数控
滚圆机滚弧机折弯机张家港倒角机液压倒角机电动
滚圆机滚弧机这是一种二元分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器[10],学习的策略是间隔最大化,最终可转化为一个凸二次规划问题的求解,运行求解设计可如图1所示。本文中,分类器的特征项达到了10000维,甚至50000维,而研究中的训练数据只有4630个。所以选择了对维数大于训练数据个数的最优化SVM分类器作为分类模型。图1支持向量机模型F基于LDA主题模型的用户消费能力模型通过观察用户所发微博文本信息,发现各个用户所关注以及乐于发表观点的主题存在很大区别。因此,研究拟通过抽取每个用户喜爱谈论的主题来考查其是否与消费能力相关。本文的主题词模型的构造采用LDA的方法来实现。用户消费能力研究-数控滚圆机滚弧机折弯机张家港倒角机液压倒角机电动滚圆机滚弧机是离线数据集合的生成概率模型,也可以称为3层贝叶斯概率模型[11]。LDA的3层结构分别是词、主题和文档。在本文中,每个用户的微博文本分词结果都是一个文档,且认为每个文档中的词是通过一定概率选择了某几个主题,并从这些主题中以一定概率选择某个词语。文档与主题之间服从多项式分布,主题与词之间服从多项式分布,模型设计则如图2所示。LDA属于机器学习中的非监督学习类型,一般用来通过非监督的方式生成文用户消费能力研究-数控滚圆机滚弧机折弯机张家港倒角机液压倒角机电动滚圆机滚弧机
本文由公司网站网站采 转摘采集转载中国知网整理! http://www.kuoguanji168.com/