“战”、“众”、“医”……重新认识这些熟悉的汉字

一横一竖,一撇一捺,一点一勾,

汉字之美,毋庸多说,

这些融合在汉字中的敬意,

而在疫情当前的情况下,

在博客中 Google 表示,研究者依据层数、注意力数量、训练步数、编码器、训练方式等因素,共测试了 8 种不同的模型,发现困惑度越低,SSA 分数越高,同时两者的相关系数很高(R^2 = 0.93)。

何为“战”?何为“众”?何为“医”?

愿这次疫情过后我们依旧心怀热望,带着期盼,带着祝福,携手向前,一起迎接美好的未来。

2月初,社交网络流传一则招工信息,称武汉火神山医院急招保洁员,月薪3万-3.5万元人民币。该消息引发网友广泛讨论,湖北某地劳动就业局还将招工信息刊载在官网。2月11日,新京报记者联系上招聘单位进行核实,证实该消息不实。

一边是救治病患,另一边是科研攻关。在抗击新冠肺炎疫情的战线上,科学技术阵线是与医疗救治一线密切相连的另一道“战壕”。

先后三次出兵伐疫,像宋彩萍、马凌这样支援武汉抗击疫情的军队医护人员,目前已超过4000人。他们当中不乏曾赴小汤山医院抗击“非典”、援助非洲抗击埃博拉疫情的白衣战士,救治经验丰富。

雷锋网了解到,困惑度(perplexity,指一种任何神经会话模型都能轻易获得的计算指标)是 seq2seq 模型(雷锋网注:一种循环神经网络的变种,包括编码器和解码器两部分,是自然语言处理中的一种重要模型,可用于机器翻译、对话系统、自动文摘)中的一个常见指标,用于评价语言模型的不确定性。

研究者将继续通过改进算法、架构、数据和计算量等,降低这一神经会话模型的困惑度。

你是否发现,有些汉字被赋予了新的意义?

2月初,军队增派950名医务人员,与先期抵达的450人“会师”武汉,承担火神山医院的救治任务。刚下飞机,军医马凌面对镜头道出“誓言”:“疫情面前我们誓死不退。”

谈及月薪近两万元的工资待遇,朱经理称价钱是公司考虑到目前的情况而定的。正常时期,武汉保洁员的平均工资为3000元。“大家既然有这份爱心和勇气做,就值这个待遇,这是爱和勇气的奖赏。”

困惑度与 SSA 强相关

首先我们要意识到,即便 Google 开源所有代码,也很少有人能培训类似 Meena 的模型。Meena 应该还在实验室里,操作起来也非常复杂,还不能将其整合到一个工具中,而且 Google 也不可能很快就将其作为一项服务向用户提供。因此,恐怕短期内 Meena 难以推出。

朱经理介绍,疫情暴发后,她所在的公司负责为专门收治新冠肺炎病人的武汉版“小汤山”医院招聘保洁和保安员。公司最早计划派人去火神山医院,还曾安排一批管理人员去接受培训。火神山医院由军方接管后,公司改为对接雷神山医院。发布招聘公告后的一周时间,已经组建起一支近300人的后勤保障队伍,目前仍在补充人员。

护航:凯旋时接你们回家

与此同时,记者 Ronald Ashri 也对 Meena 提出了进一步质疑。正如上文所述,Google 从公共领域社交媒体对话上过滤得到了 341GB 的文本,以此进行进一步的训练。那么,数百万的公共领域社交媒体对话会是这一所谓的「史上最强聊天机器人」的正确数据集吗?Meena 是否会讲出不恰当的话,可能也是一个我们要关注的点。

为计算这一指标,研究者测试了 Meena、Mitsuku、Cleverbot、DialoGPT 及小冰等常见的聊天机器人。在测试中,对于每一款聊天机器人,研究者都在 100 个对话中收集了 1600 到 2400 轮,各聊天机器人的回复都由人类评价者评分(主要依据对话的流畅性和回答的准确性),其各自性能表现如下图。

26 亿参数的端到端神经对话模型

有的字里包含祝君平安的美好希冀……

毫无疑问,人类评价或多或少存在一些问题,因此很多研究者都希望找到一个能够自动计算的评价指标,而且这个指标要能和人类评价准确对应。

同日,媒体公布了一段执行此次任务的空军运输机机组录音,令不少网友“泪目”。录音中,机组成员对驰援武汉的军队医护人员说:“希望你们在前线奋勇作战,保护好自己。等到你们凯旋的时候,我们再接你们回家。”(完)

实际上,设计智能聊天机器人是为了应对信息爆炸时代存在的信息过载问题。最初,人们把聊天机器人当作搜索引擎的终极形态进行设计和开发。不同于现有的搜索引擎,聊天机器人可针对用户的问题自然又通顺地给出精准的答案,节约了很多时间,从而带来更好的用户体验。

新提出的人类评价指标 SSA

经过几十天的不懈战斗,新冠病毒疫情趋缓,这次疫情的暴发让我们看到了很多人间大爱,我们也希望用这样的设计表达对在战疫中坚守付出人员的敬意。

而开放领域聊天机器人(也称闲聊式机器人)顾名思义针对开放域的对话场景,主题、内容不限,比如微软小冰和苹果 Siri。Google 在上述博客中表示:

2月13日,11架空军运输机载947名医护人员和74吨医疗物资抵达武汉天河机场。中新社发 陈晓东 摄

研究人员发现,超参数调整后,实现高质量对话的关键在于性能更强的解码器。

2月13日,运力支援队赶赴天河机场。当天他们迎接的是这条运输战线上的另一支护航力量——向武汉运送军队医护人员、医疗物资的11架军用运输机。这是中国空军首次成体系、大规模出动现役大中型运输机执行紧急空运任务。

“你好像瘦了。”2月9日的中部战区总医院,感染内科护士朱新苗偶遇了多日未见的丈夫、驻鄂部队抗击疫情运力支援队队员王春尚。当天,王春尚与战友们接到紧急任务,将1000套防护服运至该医院。

1月26日,军事科学院军事医学研究院研究员陈薇带领科研团队进驻武汉。将实验室搬至疫区前沿,军队科技工作者同样坚守在战疫第一线。陈薇认为,用科技力量维护国家安全,守护人民健康,把科研成果转化为战斗力,这是她的使命。经过应急科研攻关,3月16日20时18分,陈薇团队研制的重组新冠疫苗获批启动临床试验,为全民抗疫打造利器。

根据博客中展示的数据,我们相信 Meena 的确性能出众,不过 Meena 究竟什么时候能推出、真正推出后表现如何,可能都要打问号。博客中提到,目前研究团队正在就这一研究的风险及益处做进一步的评估,并可能在未来几个月内推出 Meena,旨在推动该领域的发展。

不论你是医务人员、前线志愿者,又或是普通人,是你们的付出让所有人在这场突如其来的疫难中感受到阳光般的温暖,相信我们定将取得疫情防控的全面胜利。

有的字里包含八方来援的深情厚谊;

脱去迷彩上衣,57岁的解放军中部战区总医院专家组组长江晓静换上防护服,走进重症监护室。这位与传染病斗争了34年的医务老兵本想在春节后退居二线,疫情之下,她选择继续坚守“火线”。同事说,疫情发生后,江晓静很少回家,每天只睡两三个小时“是常态”。

而 Google 开发的 Meena 正是一款开放领域聊天机器人,那么相比现有的聊天机器人,究竟有何突破?

有的字里包含白衣战士的最美逆行;

1月24日除夕当天,正在巡查病房的宋彩萍接到支援疫区的任务。当晚,她便随陆军军医大学援鄂医疗队抵达武汉。这是继6年前赴利比里亚抗击埃博拉疫情后,宋彩萍又一次临危受命。用她的话说:“军人,就该在战疫时打冲锋。”

开放领域聊天机器人的研究不仅具有学术价值,还可激发很多有趣的应用,如更深层次的人机交互、提升外语训练效果,以及制作交互式电影和游戏角色。

实际上,训练 Meena 正是为了最大程度地减少困惑度,以及预测下一个标记(雷锋网注:指对话中的下一个单词)的不确定性——据博客称,这是因为 Meena 的核心为 Evolved Transformer seq2seq 架构,即一种通过进化神经架构搜索发现的 Transformer 体系结构,能够改善困惑度。

值得一提的是,开放领域聊天机器人更符合人们心中对「人工智能」的定位,开发难度自然也很大——当前开放领域聊天机器人面临的一个严峻问题在于它们表达的内容往往没有意义,无法与用户的问题连贯起来,而且由于缺乏基本的常识和认知,不能给出针对性的回复。

进驻火神山医院当天,马凌就接收了一名呼吸骤停的患者。一连串操作争分夺秒,他将患者从危难的边缘拉了回来。如今,这位火神山医院重症医学二科副主任已在抗击疫情的前线挽救了数条生命。

冲锋:疫情面前誓死不退

当下的中国正全力进行一场前所未有的新冠肺炎疫情防控阻击战。在这片没有硝烟的战场上,中国军人白衣执甲,在救治、科研、保障等多条抗疫战线上协同作战,用行动诠释敢打硬仗的责任担当。

不难看出,Meena 相比于现有的 SOTA 聊天机器人,有着更高的 SSA 分数,甚至接近于人类的表现。

3月5日,一场特殊的火线立功授奖仪式在中部战区总医院门诊大厅举行,该院疾病预防控制科主管技师董玉梅等6名医务人员代表接过奖章。10分钟后仪式结束,董玉梅立即回到科室、穿好防护服,再次进入病房。

近年来,随着越来越多的 AI 聊天解决方案进入生活,我们需要关注最有价值的东西——定义类似人类的对话,并探究这类对话在聊天机器人领域中的角色。

雷锋网(公众号:雷锋网)了解到,Google 从公共领域社交媒体对话上过滤得到了 341GB 的文本,并以树状脉络形式组织文本进行「多轮对话」训练。研究者将每轮对话作为训练样本,同时每轮之前的 7 轮对话为语境信息,共同构成一组数据。据悉,选择 7 轮对话作为语境,既能保证训练过程获得足够长的语境信息,同时模型也能不超过内存限制。毕竟文本越长,占用的内存也越多。

有的字里包含团结一心的众志成城;

坚守:火线上的中流砥柱

而值得一提的是,Google 证明了困惑度与 SSA 高度相关。

对于武汉之外的求职者,朱经理希望不要再打电话咨询,“你们的爱心我已经收到,由于情况紧急,我需要更多时间去做要紧的事情,你们就静候武汉胜利的佳音。”

为了与疫情搏斗,武汉实行“封城”对病毒“坚壁清野”。兵马未动粮草先行,在兼顾疫情防控与城市运转的当口,中国军队再次挺身而出,紧急抽组成立驻鄂部队抗击疫情运力支援队,担负武汉市生活、医疗物资的运输保障任务,为疫情下的生活供应和医疗救治保驾护航。

朱经理称,最近一段时间,她的手机几乎无法正常使用,高峰时几乎每分钟都有电话呼入。“全国各地的号码都在给我打电话,给招聘工作带来很大麻烦。”

Meena 让我们更接近目标,但尚未让我们达到目标。

其中,任务导向型主要有问答系统、对话系统聊天机器人,分别指基于用户的问题给出一个回答(常用于智能搜索、智能家居中的家电控制等场景)和与用户进行多轮对话的聊天机器人(如客服机器人,销售机器人等)。

根据博客,上述这些表现是由 Google 根据新提出的人类评价指标「Sensibleness and Specificity Average (SSA)」得出的,而此次提出新的指标是因为,目前聊天机器人的人类评价指标颇为复杂,而且也很难形成一致的评价指标。Google 表示,SSA 能捕获基本的、但对人类对话来说很重要的属性。

根据使用场景划分,聊天机器人(chatbot)主要有开放域型(Open-Domain)和任务导向型(Task-Oriented)两种。

两天后,朱经理发现招工信息被人篡改后发至网络,除月薪被改至“30000-35000元”,其余信息基本没变,电话仍是她本人的电话。此后,不断有来自全国各地的电话打来咨询。

继“驰援一线”“科研阵线”“坚守火线”后,“运输补给线”成为中国军队疫情中作战的又一条战线。

新冠肺炎疫情发生后,中国军队闻令而动,派出多批医护人员支援武汉。

开放领域聊天机器人开发难度大

雷锋网原创文章,。详情见转载须知。

出于疫情管控的原因,她只接受人在武汉的求职者。“是武汉的电话我就接,有勇气来做的我再聊。”

负责招聘工作的武汉市天盾保安服务有限公司朱经理称,1月底时她曾以微信群发的方式发布一则招工信息,表示武汉版“小汤山”医院需要招聘保洁员,月薪18000-20000元,包吃包住并提供完整的防护设备。

另外,在实用性方面,诚然 Meena 作为一款开放领域聊天机器人,能够实现多轮对话。不过 Meena 并不能协助用户完成某项任务、学习某项新技能,或为身处困境的用户给予情感或心理支持,和用户的聊天没有明确的目的。而耗费时间进行无意义的交谈,在我们所处的时代大背景下似乎并非理想产品。

抢救生命、连续作战,冲锋过后是军队医护人员在战疫一线的坚守。“火线上的中流砥柱”成了人们对一线医务工作者的一种褒奖,即便是立功授奖也要在“阵地”上进行。

防控疫情、医疗救治、抢险救灾……每当危难来临时,人民军队总会挺身而出、全力以赴。

Google 在博客中介绍称,Meena 是个 26 亿参数的端到端训练的神经会话模型,是 GPT-2 模型最大版本(15 亿参数)的 1.7 倍。据称,Google 利用 400 亿字的数据集,通过 2048 个张量处理单元(即 Tensor Processing Unit,Google 专用 AI 芯片)训练了 30 天,得到了最佳版本。实验表明,比起聊天机器人 SOTA,Meena 能更好地完成对话,内容也更具体、清楚。

这些被漫画师重新设计过的汉字,

Author: enoffside.com