我们已经讨论了情绪评分以及评分中涉及的技术和变化。但这究竟是如何做到的?如何将定性文本转换为定量数据?有三种方法可以做到这一点。
但在计算开始之前,必须先处理数据。原始评论中有很多数据对算法没有任何用处。我们只需要为算法提供有影响的单词。无论情绪是积极的、消极的还是中性的,以及这些单词是否表现出情绪。
在分析之前,原始数据需要经过几个处理。我们将使 尼日利亚电报号码数据 用以下来自 Yelp 评论的示例来了解数据处理。
积极情绪得分
积极情绪得分
当这样的评论被输入到系统中时,系统做的第一件事就是标记化。标记化就是系统将每个单词分成标记进行分析的过程。
文本规范化
在单词被标记后,系统会执行文本规范化。文本规范化是系统删除评论中的非文本项。例如,系统在此阶段会删除逗号、句号、感叹号和其他标点符号。
在删除评论中的所有非文本元素后,系统会将所有单词分解为词干。例如,在上面的例子中,“breaks”一词读作“break”。同样,“fixes”一词读作“fix”。
客户情绪评分分析中数据预处理的最后一步是删除多余的单词。上面的例子包括“非常”、“每个”和“说不完”等词。
最后,在情绪分析中被评分的文本看起来会像这样。“惊人的快速可靠诚实公平喜欢‘马上解决’‘优质服务’‘喜欢这家公司’”我知道这与人类的语言不一致。然而,它包含了评分情绪所需的所有重要信息。
使用最后的陈述,那么我们如何使用这三种方法计算客户情绪分数?
阅读情绪追踪:如何了解客户的想法?