电脑如何写文章 电脑也能写出连贯的文章吗?
硅谷资深机器学习工程师
主页:
生成式模型大行其道的今天,我们已经知道电脑能够自己写文章了. 但是他们文章的连贯度如何呢?
本文是语篇连贯度分析专题的上篇. 下篇专门讲局部连贯度分析的不同模型.
本文要点
简单介绍语篇连贯度分析
如何分析语篇的局部连贯度
如何分析不同文体的全局连贯度
简单介绍语篇连贯分析
Q1: 我们为什么在乎文本的连贯度高不高?
A1: 任何需要保证文本输出质量的NLP产品都需要语篇连贯度分析. 比如信息抽取、自动摘要、机器翻译.
Q2: 什么是连贯()?
A2: 连贯是一种句子之间的关系,定义了逻辑顺畅的语篇与随机排列的句子们之间的区别.
Q3: 可以从哪些角度一个文本的连贯度?
A3: 分为局部连贯(local )以及全局连贯( ).
局部连贯是指语篇中连续N句话之间的关系,比如前后连接的句子对(span)之间的连贯关系;
全局连贯是指站在段落乃至全文的高度,看语篇的行文结构对全文连贯度的影响.
Q4: 什么是语篇连贯度分析任务?
A4: 有很多方向,比如自动的对语篇进行解析,进而得到全文逻辑结构的图形表示;训练模型自动衡量文本的连贯度并打分.
如何分析语篇的局部连贯度三种分析局部连贯的角度
一段话之所以连贯,可能是因为前后句子之间有逻辑关系,也可能是因为它们在讨论同一个现实世界的实体,还有可能是因为它们在讨论一个核心的话题.
句子之间存在连贯关系( )
句子之间可以存在各种各样的连贯逻辑关系.
有RST树和PDTB两种不同风格的框架来句子之间不同的逻辑关系,第二部分会细讲.
存在-based
句子们在讨论同一个中心的实体(称之为).
这个研究角度会追踪一个语篇里面,目前被讨论的实体是什么,如果实体变来变去,显然这个语篇就不是一个很连贯的语篇.
存在
句子们在讨论同一个话题,也就是使用同一个 field里面的词语 e.g. I built , and the sides of … I have thus a tight and … with , a each side.
下篇专门讲局部连贯度分析的Post里面会包括:
如何解析句子间的连贯关系( )
如何追踪语篇当下的核心实体
如何使用纯神经网络给语篇的连贯度打分
如何分析不同文体的全局连贯度
全局连贯是指站在全文的高度,看语篇的行文结构对全文连贯度的影响.
起源可以从Propp’s model开始说:
它将故事的常见角色总结了出来,称为 . 比如主人公(Hero),反派(),Donor,等.
这里简单带过对两种不同文体的全局连贯度研究:议论文和科研论文.
如何研究议论文的全局连贯度
根据亚里士多德的理论,要论证一个观点可以通过三种修辞形式:
数据集
现代模型主要研究用逻辑论证(logos)的议论文,一般训练集是标注好论点claim,论据的议论文.有时候还会包括论证关系( ), 比如或者.
示例议论文数据:
“(1) and art a about arts than .
(2) In most and art , in terms of the , and are .
(3) an is not the same as it with our own eyes, as
(4) the does not show the or three- of the art, which is to study.”
第1句话是论点
第2,3句话是支持论点的论据
第4句话是支持3的论据
所以表示成函数就是(2, 1), (3, 1), (4, 3)
一篇议论文可以表示为下图 (感觉高中时候的同学要是有了能自己写议论文的算法,好多人都不怕写作文了哈哈)
图片来自论文
尖头箭头表示,圆头箭头表示.
有趣的是,可以注意到表示了反证法
先提出反对的观点, 用 9支持这个观点, 然后用 11和 10攻击这个观点,论证这个观点是错误的.
分析议论文结构的模型
一般是两个文本分类器,一个负责区分论点、论据和非议论文本(non-).
另一个负责区分两句话之间的关系是, , 还是都没有.
另外的研究方向如何研究科研论文的全局连贯度
科研论文的结构一般包括目的、方法、结果、与已有研究的比较等.
数据集
论文中的每个句子被分为15种类别的标注.
比如:
目的AIM —— 句子表明了研究目的
新方法
新结果
使用USE —— 句子表明了研究中使用了什么工具/方法
缺陷 —— 句子指出了本领域未被解决的问题,已有方案的不足
支持 —— 句子提供了已有研究对本研究的支持
矛盾 —— 句子提出了对某已有结论的挑战
整个表如下:
图片来自论文
总结
本文作为语篇连贯分析的上篇,介绍了这个领域的基本概念, 研究框架, 数据集和模型. 局部连贯度可以通过研究三条路研究:判断连贯关系,追踪讨论实体,以话题为中心.
不同问题的全局连贯度不同,介绍了议论文文体和科研论文文体.
下一篇我们将聚焦到语篇的局部连贯度分析,具体看每个研究角度都有什么理论框架和模型.
原文链接:
本文由作者授权AINLP发布,点击'阅读原文'直达原文链接,欢迎投稿,AI、NLP均可。
欢迎大家关注AINLP公众号,加入我们的技术交流群(添加微信id:,备注当前工作方向),一起维护一个纯粹的NLP技术交流环境。