本文来自微信公众号:APPSO (ID:appsolution),作者:方嘉文,原文标题:《这些「赛博格」正在用脑机接口重启人生:失语五年重新讲话,瘫痪患者用意念打游戏》,题图来自:AI生成
本文来自微信公众号:APPSO (ID:appsolution),作者:方嘉文,原文标题:《这些「赛博格」正在用脑机接口重启人生:失语五年重新讲话,瘫痪患者用意念打游戏》,题图来自:AI生成
Casey Harrell轻微地移动自己的嘴巴,发出难以辨析的声音。
他的第一道「题」是:
What good is that?(那有什么用?)
理想情况是,尝试讲出这句话时,Harrell大脑产生的信号会通过脑机接口完成解码,在屏幕上打出这几个词语。
第一次尝试后,研究团队不得不把测试停下来。
Harrell哭了,他的妻子兼照料者Levana Saxon哭了,BrainGate研究团队哭了。
他第一次尝试就成功了。这是因「渐冻症(肌萎缩性脊髓侧索硬化症,简称ALS)」而瘫痪并失去说话能力的Harrell在过去五年来第一次「说话」。
大家的情绪都很激动,测试不得不暂停一下。
无法沟通,为何是「痛中之痛」?
我感觉自己就像活在一场慢速播放的车祸之中。
Harrell这样形容确诊渐冻症后的生活。
这个目前仍未找到治愈方法的疾病,会让患者失去对肌肉的控制能力,导致瘫痪、进食困难、失语,甚至无法控制呼吸所需的肌肉。
你知道自己会失去这一切,但你不知是何时。
那个感觉就是,我们完全不知道我们会在什么时候失去哪个肢体能力,特定能力又能保留多久。我们真的就是某天突然醒来,就发现「这动不了了。从此这方面就要人帮助才行了。」
Harrell的太太Levana Saxon说道。
和肢体瘫痪相比,让Harrell更崩溃的是失去了自己的沟通能力。
刚确诊时,也正好是两人女儿刚出生的时候。Harrell最喜欢的就是给女儿唱歌,日间能随时现编滑稽的歌曲,描述着自己在做的事情,晚上则会唱着温柔的小夜曲,哄女儿睡觉。
然后突然有一天,他就唱不出歌了:
我失去沟通能力的过程非常漫长,最开始是失去给女儿唱歌的能力,然后开始要不断重复自己的话别人才能听懂,到后面必须要有专人为我翻译。
另一个让他们痛心的地方,在于朋友的消失。
你无法想象,有多少人因为不想目睹这场慢动作的车祸而远离我们。这发生在所有在面对绝症和慢性病的家庭。人们希望你要不就好起来,要不就死。
在Harrell看来,这些人离开不是因为他们是坏人,只是他们不知道自己能做什么。
当你没法用语言和他们去聊这个问题时,情况就变得更糟糕了。
而留在身边的人,也因无法沟通而沮丧。
Saxon表示,自己之前近乎每天都会让丈夫不舒服:
我会问他:「我可以移动你的手臂吗?」然后我会以为他说的「可以」,但实际上他说的却是「不」。然后我就会移动他的手臂,导致全身痉挛。
Saxon也没法请人协助照料Harrell,因为没人能理解他的话。
「开箱即用」的技术,让他得以恢复全职工作
It just works.(它就是能用。)
这句话大家应该都不陌生。它常被用于形容设计直观易用的产品,开箱上手就能开用,没有繁复的使用说明。
没想到的是,今天这句话居然已经被用来形容脑机接口。
2023年7月,Harrell接受了时长达5小时的手术,在其大脑的中央前回植入了4个4x4mm大小的平台。
这些跟M&M巧克力豆一般大小的设备每个有64个电极,合计有256个电极,比过往研究更多,这也意味着它将得收集到更多数据。
和所有脑机接口设备一样,除了植入大脑的传感器外,研究团队还需要解码器,用来解读传回的数据。
我们在之前的文章也介绍过,用脑机接口来构建语言对话能力有两种方式。
早期,这类技术多以「一个字母一个字母」的拼写式输出为主。
近年来,研究团队开始采用更「自然」的输出模式——逐个完整单词地输出。
在这种模式下,算法会将单词拆分成更小的语音单位音素。譬如,单词「Hello」里就有四个音素:「HH」「AH」「L」和「OW」。
2023年公布的两项采用这种算法的脑机接口研究中,参与者在开始使用前都需对系统进行较长时间训练,等于是让算法学习患者大脑电流模式。
当时,两位受试者的训练时间分别为几周和将近半年。
Pat Bennett是BrainGate项目的上一位公布的受试者,她用了半年时间来训练系统
而Harrell这次,则只调试了大概半小时。
在这背后,团队在正式让Harrell启用脑机接口和解码算法前,先将算法放一个计算模拟上去测试练习,多了这一步后,「系统从第一天就能用起来」。
当屏幕上显示的词语的确是Harrell想说的,那他就可以完成确认,并用基于他失语前的声音素材训练出来的人声读出来,完成「说话」。
更振奋人心的是,除了能快速适应外,这套脑机接口的准确率也很出色。
经过两小时的使用,在高达12.5万词库的前提下,脑机接口输出的准确率依旧高达90%。而在几天后,识别的准确率更是升高到97%。
这个97%的准确率,不仅比过往类似研究(约75%)要高,甚至比一些手机的语音输入文字识别率都要高。
不过,Harrell语言的输出速度还是比平常语速慢,每分钟只可以说33个单词,低于平常语速160词/分钟。
它已经从一个科学研究展示变成了Casey每天可以用来和家人朋友说话的系统。
该项目负责人David Brandman说道。
对于Harrell而言,这个技术让他恢复了独立沟通的能力,他不再需要依赖专门的翻译或只能被误解。
他的太太Saxon表示,Harrell现在开始重新和好朋友联系起来:
他们可以直接来到我们家,坐下来和他聊天。进行真正的,深入的对话。
尽管低于平常语速,但因为准确率较高,Harrell因此开始在家里恢复了全职工作。
在患病前,Harrell是一名气候活动家,在NGO担任高级策略师,主要工作是推动资产管理公司以投资的方式去投入环境保护。
更重要的是,现在Harrell也能重新和女儿沟通了。
差不多两年了,她都没有办法和我沟通。现在,我可以帮助她妈妈去教导她。我可以和她建立一个更深的关系,告诉她我在想什么。
技术的「人性」
我是他们口中的高级用户(power user)。
每周下来,Harrell使用脑机接口的时间长达70小时。值得庆幸的是,这个技术在长时间运行下表现也不错。
我们在工程和测试上做了很多工作,也加入了很多小创新,才让它长时间运行时也能保持可靠。
BrainGate项目成员Nicholas Card说道。
虽然现在Harrell可以「说话」了,但他还不「满足」,他想念唱歌。
每天「上机」时,他都要先用一些「测试句子」来看看设备是否表现正常。
这些时候,Harrell脑里冒出的都是歌曲。最近,他很喜欢「唱」的是美国乐队Chicago的「If You Leave Me Now」:
If you leave me now,you will take away the biggest part of me.
BrainGate也在努力尝试将音乐重新带回到他的生活里。
这些勇于承担风险的「先锋」,也在塑造着我们未来的技术。
Harrell对唱歌的喜爱,在推动BrainGate在研究如何在算法中融入旋律的知识。
因闭锁综合症而失去对肌肉控制的Ann Johnson,则是加州大学脑机接口项目的受试者。
通过和Harrell使用类似的技术,Johnson也能将自己的话语通过屏幕播出。和Harrell不同的是,她的表达配合了数字化身,她的脑信号除了会变成文字,还会成为数字化身的表情。
同样对沟通有渴求的Johnson,想要的不是唱歌,而是当咨询师,用自己康复的经验来帮助类似病人。
这种情况下,有表情有语音的表达起来会更自然。
今天,马斯克的脑机接口公司Neuralink公布了第二位受试者的情况。
Alex也在用自己的方式使用脑机接口技术。
除了和第一位受试者Noland Arbaugh一样都喜欢玩游戏外,第二位受试者Alex原来是一位汽车检修员,喜欢建造东西。
Alex在习惯脑机接口后,已经开始用CAD软件来设计物件,为自己的Neuralink充电器设计了一个支架,并真的3D打印出来使用了。
无论是脑机接口还是AI,它们都更像是「通用技术」,它们「进化的形态」,除了由研究人员支持外,经常也是由那些真正去使用它们的人塑造。
这些技术的「分支」背后,都是人类去连接和创造的欲望。
本文来自微信公众号:APPSO (ID:appsolution),作者:方嘉文
支持一下 修改