投稿可以用德语或英语撰写

Exclusive, high-quality data for premium business insights.
Post Reply
Bappy11
Posts: 348
Joined: Sun Dec 22, 2024 6:06 am

投稿可以用德语或英语撰写

Post by Bappy11 »

在本研究中,我们旨在使用由分布语义学建立的程序,在卡尔德隆·德拉巴尔卡 (Calderón de la Barca) 创作的 112 部戏剧中区分喜剧和悲剧。定性研究人员已经将其中 15 部新喜剧分别归类为悲剧或喜剧;对于另外 82 部戏剧,分类未知。探索了四种独立的文档嵌入方法,它们在矩阵创建和缩减以及相似性或距离矩阵的计算方面彼此不同。通过应用最强矩阵缩减的分类程序获得最佳结果(与这些戏剧的预先确定的分类相比)。此外,还进行了对比词汇分析和词嵌入,分析基于四种测试方法生成的单词列表,或基于两个子语料库的对数似然概率分布,这两个子语料库仅包含已确定为喜剧或悲剧的戏剧。此步骤允许识别 130 个术语,每个术语都可区分喜剧或悲剧。结果表明,所探索的方法识别悲剧的准确率高于喜剧,表明悲剧表现出更强的词汇凝聚力。同时,很明显,人们可以更恰当地将诸如“悲剧”和“喜剧”之类的分类视为两极,在两极之间可以观察到逐渐的差异,而随后的过渡区域包含新喜剧 ,在先前的研究中被描述为悲剧喜剧或有丝分裂喜剧。

在本研究中,我们应用分布语义学的程序对卡尔德隆·德拉巴尔卡 (Calderón de la Barca) 的 112 部戏剧中的喜剧和悲剧进行了分类。其中 15 部新喜剧已被定性研究人员归类为悲剧,15 部被归类为喜剧;另有82部电视剧的分类不详。使用了四种无 监督文档嵌入方法,它们在矩阵创建和缩减以及相似度或距离矩阵的计算方面有所不同。与之前的这些戏剧的分类相比,最好的结果是通过进行最 阿曼电报数据 强矩阵约简的分类方法取得的。此外,还进行了带有词嵌入的对比词汇分析 。这是基于四种测试方法的单词列表,或基于仅包含被归类为喜剧或悲剧的戏剧的两个子语料库的对数似然概率分布。此步骤可以识别出 130 个对喜剧或悲剧具有歧视性的术语。结果表明,所探索的程序识别悲剧的准确率高于喜剧,这表明悲剧具有更多鲜明的特征。然而,也显而易见的是,将“悲剧”和“喜剧”等分类视为两极更为恰当,它们之间存在着逐渐的差异,并且在其过渡领域中存在着新的喜剧 ,在研究中这些喜剧被称为悲剧喜剧或有声喜剧。

版本 1.1(2023.04.20)
进行了以下修改:在第 1 段中添加了对评论的回应。更新了 Jörg Lehmann 的电子邮件地址。
Post Reply