威诺格拉德模式挑战(Winograd Schema
Challenge)用来测试机器是否能够识别一句话中的前指关系(anaphora),即找出其中某一代词的先行词。一个典型的例子为:
“市议会拒绝给示威者颁发许可,因为他们[担心/宣扬]暴力。”
当句中使用“担心”一词时,“他们”指的是市议会。而当使用“宣扬”一词时,“他们”指的是示威者。人通过常识可以很简单地看出两种情况下“他们”指的分别是什么,但对于机器来说十分困难。
ChatGPT的语料库里面,一定包括《红楼梦》以及各种红学研究著作。下面用Winograd Schema Challenge考查一下ChatGPT的阅读理解能力。
这里选取的是一段人物关系最复杂的对话。央视版电视剧《红楼梦》里的对白,和原著几乎一字不差。严格说,这还不是威诺格拉德模式,但是也够难的了。体验一下,如果是你能理解多少:红楼梦 第12集 埋香冢飞燕泣残红(14'00'-16'30')。
以下是和ChatGPT的对话:
“市议会拒绝给示威者颁发许可,因为他们[担心/宣扬]暴力。”
当句中使用“担心”一词时,“他们”指的是市议会。而当使用“宣扬”一词时,“他们”指的是示威者。人通过常识可以很简单地看出两种情况下“他们”指的分别是什么,但对于机器来说十分困难。
ChatGPT的语料库里面,一定包括《红楼梦》以及各种红学研究著作。下面用Winograd Schema Challenge考查一下ChatGPT的阅读理解能力。
这里选取的是一段人物关系最复杂的对话。央视版电视剧《红楼梦》里的对白,和原著几乎一字不差。严格说,这还不是威诺格拉德模式,但是也够难的了。体验一下,如果是你能理解多少:红楼梦 第12集 埋香冢飞燕泣残红(14'00'-16'30')。
以下是和ChatGPT的对话:
