狗狗也有方言,当AI开始翻译动物语言
狗狗也有方言,当AI开始翻译动物语言
狗狗也有方言,当AI开始翻译动物语言界面新闻(xīnwén)记者 | 丁欣雨
界面新闻编辑 | 姜妍
你想了解猫咪发出咕噜咕噜的响声、小狗(xiǎogǒu)一直舔人是什么含义吗?数字技术正在帮助(bāngzhù)人类实现跨物种交流的可能。
根据本月由国家知识产权局发布的一份专利文件,百度拟定开发一种(yīzhǒng)能破译动物交流方式的系统,利用(lìyòng)收集到的声音、动作数据,经人工智能识别出情绪状态结果后,再映射到语义含义中(zhōng),翻译成人类(rénlèi)语言。
而在国外类似的(de)研究正在如火如荼进行中,在今年世界(shìjiè)海豚日(4月14日)前后,谷歌也发布了一款即将在夏天开源的“DolphinGemma”AI大模型(móxíng),称其能与海豚实现(shíxiàn)水下实时交流,并对它们(tāmen)的后续声音序列进行预测。这种高智商的社会化物种会在从鼻腔喷出空气时发出尾音音节(coda)声来彼此交流,就像(xiàng)人类使用摩斯密码一样。
和海豚同属鲸类的鲸鱼们的语言同样在被研究(yánjiū),近期在《Nature》发表的一项研究,就是利用人工智能梳理(shūlǐ)了鲸鱼近9000个尾音,发现了其内含的新特征——“弹性伸缩(rubato)”和“装饰音(ornamentation)”,鲸鱼会根据对话(duìhuà)语境,采用在弹性伸缩、装饰音与稳定(wěndìng)节拍(jiépāi)间组合变换的方式,创造出独特尾音。研究人员更(gèng)因此提出了一种类似于我们国际音标(guójìyīnbiāo)的“抹香鲸音标”。
几十年来,鲸类动物的语言一直是自然(zìrán)声学研究的重中之重,这既(jì)源自对于其他物种的探索冲动,还有更加切实的诉求。1970年,美国生物学家罗杰·佩恩录制了一张全程只有海浪背景下鲸鸣声的音乐专辑《座头鲸之歌》,销量超过10万张,并激发“拯救(zhěngjiù)鲸鱼”国际(guójì)运动的发生,最终阻止了多种海洋哺乳动物的灭绝(mièjué)。

图源:unsplash
而在当下,“鲸类翻译计划(CETI)”和纽约大学法学院(fǎxuéyuàn)超人类生命项目(MOTH)也试图(shìtú)借鲸类动物声音研究来促进动物新权利的(de)诞生,影响法律裁决。他们发表在《生态法季刊》上的一篇文章指出,了解鲸类交流(jiāoliú)的复杂性和具体内容,能揭示其在船舶交通、石油勘探和深海(shēnhǎi)采矿等人类活动产生的水下噪音中受到的痛苦与折磨。
在(zài)(zài)反对赋予动物权利的论点中,语言被认作是人类独有的特征。世界各地的土著社群早已意识到动物有自己的交流方式,而(ér)西方科学界则习惯完全否定(fǒudìng)动物交流的概念,他们更倾向于注重视觉而非听觉,觉得人类无法观察到的事物就(jiù)不存在。而这门科学利于打破这种固定思维,也能更好地与土著群体对于鲸类动物的知识传统相融合(rónghé)。在他们眼中,鲸鱼承载一种古老的神圣精神,把万物凝聚起来(qǐlái),2024年,新西兰、塔希提岛和库克群岛就曾(céng)签署一项“海洋宣言”,承认鲸鱼具有法人地位。
与动物交流(jiāoliú)的(de)创想在国外也落实到了宠物领域,全球首个人宠翻译器Traini在2024年底于iOS程序推出,这款主要用来理解“狗狗(gǒugǒu)语”的软件由(yóu)一个华人团队进行开发,依靠其(qí)自主研发的PEBI(宠物情绪与行为(xíngwéi)智能)模型,收集主要来自北美和欧洲区域应用平台上的用户社区(shèqū)信息,目前覆盖了120个不同的狗狗品种(zhǒng),能够检测(jiǎncè)12种情绪,包括快乐、恐惧等基本情绪和其之外的细微感受。用户只要上传相关的声音、图片和视频,就能实现翻译,且官方数据显示准确率高达至81.5%。反过来,Traini也能把用户的话语例如“看我”“一起走”转换成犬吠,传递给狗狗。
Traini的CEO孙邻家近期接受一条采访时表示,狗狗(gǒugǒu)拥有的语言表达功能受到(shòudào)其心智程度(chéngdù)、社会化进程、品种和生活地区的影响而(ér)呈现差别。比如“边牧学得更快(kuài),词汇量就会更大”;而由于“狗狗也有方言”,这个主要面向英文用户的AI原生应用,听不懂中国狗的情况也会出现。“当然还有一种可能,就是狗狗听懂了,但是不想做。就像一个小孩(xiǎohái)子在(zài)打游戏,你跟他说去做作业,小孩听懂了,但他就是不想。”

社交媒体截图
就如几百年前显微镜的发明拓展了人类视觉所能触达的极限那样,人们(rénmen)也(yě)在依靠AI开启一个全新的声音(shēngyīn)世界。用科技记者艾德·永(Ed Yong)的话来说,当意识(yìshí)到动物声音也享有一套历史性(lìshǐxìng)的、社会性的互动代码,那些人类独有的权利也将有可能扩展到非人类动物上,同时丰富所谓“语言(yǔyán)”的包容性定义、重新审视人与自然的关系。
《听不见的(de)大自然:博物学家(bówùxuéjiā)的自然聆听笔记》一书的作者、牛津大学环境地理学博士凯伦·巴克还提醒我们注意,物种间的交流声也能间接反映气候变化的问题,例如非洲大草原上鸟类和其他物种经常在黎明或黄昏时刻进行合唱,是由于(yóuyú)这些时刻空气湿度较高,声音也能传播得更(gèng)远、更快。但随着大气温度和湿度受到影响,它们(tāmen)在更干燥和炎热的环境中(zhōng)更难正常交流。失去相互(xiānghù)警告威胁和找到配偶的机会,动物的安全性也会降低,最终影响到它们的繁衍和生存。

[加] 凯伦·巴克 著 邓婧文 译北京科学技术出版社 2024-3
人工智能实现的(de)跨物种交流,“既能用来引发更深层次的亲密感,也可能用来培养一种支配感和操控能力,从而驯化人类以前从未控制(kòngzhì)过的野生(yěshēng)物种。”巴克称,德国的一个研究小组将(jiāng)蜜蜂信号编码到一个机器人当中,把它送到蜂巢(fēngcháo)里,机器人能利用蜜蜂的摇摆舞交流,指示蜜蜂停止移动,并飞往特定的花蜜源。研究的下一阶段会将机器人植入蜂巢,让蜜蜂从一开始就接纳这些机器人,把它们视作群体的一员。“这样一来(zhèyàngyīlái),我们将对蜂巢拥有前所未有的控制,而且动物在军事上的使用(shǐyòng)由来已久,我觉得这会是一条值得警惕(jǐngtì)的路径。”

界面新闻(xīnwén)记者 | 丁欣雨
界面新闻编辑 | 姜妍
你想了解猫咪发出咕噜咕噜的响声、小狗(xiǎogǒu)一直舔人是什么含义吗?数字技术正在帮助(bāngzhù)人类实现跨物种交流的可能。
根据本月由国家知识产权局发布的一份专利文件,百度拟定开发一种(yīzhǒng)能破译动物交流方式的系统,利用(lìyòng)收集到的声音、动作数据,经人工智能识别出情绪状态结果后,再映射到语义含义中(zhōng),翻译成人类(rénlèi)语言。
而在国外类似的(de)研究正在如火如荼进行中,在今年世界(shìjiè)海豚日(4月14日)前后,谷歌也发布了一款即将在夏天开源的“DolphinGemma”AI大模型(móxíng),称其能与海豚实现(shíxiàn)水下实时交流,并对它们(tāmen)的后续声音序列进行预测。这种高智商的社会化物种会在从鼻腔喷出空气时发出尾音音节(coda)声来彼此交流,就像(xiàng)人类使用摩斯密码一样。
和海豚同属鲸类的鲸鱼们的语言同样在被研究(yánjiū),近期在《Nature》发表的一项研究,就是利用人工智能梳理(shūlǐ)了鲸鱼近9000个尾音,发现了其内含的新特征——“弹性伸缩(rubato)”和“装饰音(ornamentation)”,鲸鱼会根据对话(duìhuà)语境,采用在弹性伸缩、装饰音与稳定(wěndìng)节拍(jiépāi)间组合变换的方式,创造出独特尾音。研究人员更(gèng)因此提出了一种类似于我们国际音标(guójìyīnbiāo)的“抹香鲸音标”。
几十年来,鲸类动物的语言一直是自然(zìrán)声学研究的重中之重,这既(jì)源自对于其他物种的探索冲动,还有更加切实的诉求。1970年,美国生物学家罗杰·佩恩录制了一张全程只有海浪背景下鲸鸣声的音乐专辑《座头鲸之歌》,销量超过10万张,并激发“拯救(zhěngjiù)鲸鱼”国际(guójì)运动的发生,最终阻止了多种海洋哺乳动物的灭绝(mièjué)。

而在当下,“鲸类翻译计划(CETI)”和纽约大学法学院(fǎxuéyuàn)超人类生命项目(MOTH)也试图(shìtú)借鲸类动物声音研究来促进动物新权利的(de)诞生,影响法律裁决。他们发表在《生态法季刊》上的一篇文章指出,了解鲸类交流(jiāoliú)的复杂性和具体内容,能揭示其在船舶交通、石油勘探和深海(shēnhǎi)采矿等人类活动产生的水下噪音中受到的痛苦与折磨。
在(zài)(zài)反对赋予动物权利的论点中,语言被认作是人类独有的特征。世界各地的土著社群早已意识到动物有自己的交流方式,而(ér)西方科学界则习惯完全否定(fǒudìng)动物交流的概念,他们更倾向于注重视觉而非听觉,觉得人类无法观察到的事物就(jiù)不存在。而这门科学利于打破这种固定思维,也能更好地与土著群体对于鲸类动物的知识传统相融合(rónghé)。在他们眼中,鲸鱼承载一种古老的神圣精神,把万物凝聚起来(qǐlái),2024年,新西兰、塔希提岛和库克群岛就曾(céng)签署一项“海洋宣言”,承认鲸鱼具有法人地位。
与动物交流(jiāoliú)的(de)创想在国外也落实到了宠物领域,全球首个人宠翻译器Traini在2024年底于iOS程序推出,这款主要用来理解“狗狗(gǒugǒu)语”的软件由(yóu)一个华人团队进行开发,依靠其(qí)自主研发的PEBI(宠物情绪与行为(xíngwéi)智能)模型,收集主要来自北美和欧洲区域应用平台上的用户社区(shèqū)信息,目前覆盖了120个不同的狗狗品种(zhǒng),能够检测(jiǎncè)12种情绪,包括快乐、恐惧等基本情绪和其之外的细微感受。用户只要上传相关的声音、图片和视频,就能实现翻译,且官方数据显示准确率高达至81.5%。反过来,Traini也能把用户的话语例如“看我”“一起走”转换成犬吠,传递给狗狗。
Traini的CEO孙邻家近期接受一条采访时表示,狗狗(gǒugǒu)拥有的语言表达功能受到(shòudào)其心智程度(chéngdù)、社会化进程、品种和生活地区的影响而(ér)呈现差别。比如“边牧学得更快(kuài),词汇量就会更大”;而由于“狗狗也有方言”,这个主要面向英文用户的AI原生应用,听不懂中国狗的情况也会出现。“当然还有一种可能,就是狗狗听懂了,但是不想做。就像一个小孩(xiǎohái)子在(zài)打游戏,你跟他说去做作业,小孩听懂了,但他就是不想。”

就如几百年前显微镜的发明拓展了人类视觉所能触达的极限那样,人们(rénmen)也(yě)在依靠AI开启一个全新的声音(shēngyīn)世界。用科技记者艾德·永(Ed Yong)的话来说,当意识(yìshí)到动物声音也享有一套历史性(lìshǐxìng)的、社会性的互动代码,那些人类独有的权利也将有可能扩展到非人类动物上,同时丰富所谓“语言(yǔyán)”的包容性定义、重新审视人与自然的关系。
《听不见的(de)大自然:博物学家(bówùxuéjiā)的自然聆听笔记》一书的作者、牛津大学环境地理学博士凯伦·巴克还提醒我们注意,物种间的交流声也能间接反映气候变化的问题,例如非洲大草原上鸟类和其他物种经常在黎明或黄昏时刻进行合唱,是由于(yóuyú)这些时刻空气湿度较高,声音也能传播得更(gèng)远、更快。但随着大气温度和湿度受到影响,它们(tāmen)在更干燥和炎热的环境中(zhōng)更难正常交流。失去相互(xiānghù)警告威胁和找到配偶的机会,动物的安全性也会降低,最终影响到它们的繁衍和生存。

人工智能实现的(de)跨物种交流,“既能用来引发更深层次的亲密感,也可能用来培养一种支配感和操控能力,从而驯化人类以前从未控制(kòngzhì)过的野生(yěshēng)物种。”巴克称,德国的一个研究小组将(jiāng)蜜蜂信号编码到一个机器人当中,把它送到蜂巢(fēngcháo)里,机器人能利用蜜蜂的摇摆舞交流,指示蜜蜂停止移动,并飞往特定的花蜜源。研究的下一阶段会将机器人植入蜂巢,让蜜蜂从一开始就接纳这些机器人,把它们视作群体的一员。“这样一来(zhèyàngyīlái),我们将对蜂巢拥有前所未有的控制,而且动物在军事上的使用(shǐyòng)由来已久,我觉得这会是一条值得警惕(jǐngtì)的路径。”

相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎