听觉脑机接口——检测声压级变化以实现自动音量控制
视频和音频媒体是常用的娱乐方式。当音量差异较大时,用户需要调节设备的音量。如果能够在无需身体动作的情况下控制音量大小,体验可能更加舒适。对于有些由于受伤或疾病等原因无法手动调节音量的人来说自动音量控制系统更具吸引力。近日,日本长冈技术科学大学工程学院研究团队开展了基于脑机接口开发一种自动音量控制系统的研究,利用EEG测量的脑活动来控制外设的音量,而无需进行物理调节。相关研究成果已发表在《Heliyon》期刊。
研究团队使用oddball实验范式,给出连续的外部刺激,要求被试注意不频繁的刺激。在对不频繁的刺激的响应中,观察到特定的事件相关电位(ERPs)。为了避免对刺激的关注可能会丧失对主要内容的沉浸感,研究人员将声音的声级本身作为oddball范式的刺激,使用相同类型的刺激(白噪声),但不同的声级作为目标、非目标和频繁刺激,研究自动音量控制的脑机接口是否可行,验证oddball范式是否能够检测到不同的声级。
在一个目标实验中(1-Target),研究人员准备了两种不同声级的声音,被试被要求专注于一个声音目标(不频繁,70 dB),作为目标刺激,该声音的音量(70 dB)较其他声音(60 dB)高。通过EEG测量脑活动,研究发现目标声音具有显著正波(P300诱发电位),目标和非目标声音的分类准确率达到0.90,能够检测到被试专注的特定声级。在两个目标实验中(2-Target),研究人员准备了三种不同声级的声音,并在不同的小节中改变了目标声级,引入了低音量(50 dB)作为第二个声音目标。研究发现同样观察到了P300诱发电位,目标和非目标声音的二分类准确率达到0.76,能够检测到两类声级(大或小)。此外,研究发现相较于小音量,大音量可以获得更好的准确率。上述结果表明了通过BCI进行自动音量控制的可能性,但仍需提高其准确性。
材料与方法
被试:共有10名无听力障碍病史的健康男性被试,其中7名参与了1-Target和2-Target实验,其余的参与者仅参与了2-Target实验。由于预计到可能存在任务难度和准确性的变化,专门为2-Target实验增加了被试。
实验设置:被试坐在与操作员完全隔离的隔音室的椅子上。通过立体声耳机播放声音刺激。白噪声刺激由计算机生成,并使用数模转换器和模拟耳机放大器播放。采样频率为44.1 kHz,分辨率为16bits。声压级为经过校准的声级计的值,为了进行校准,将麦克风连接声级计,放置在假头的鼓膜处,耳机置于假头耳朵上,测量声压级。
每个实验包括20小节,每个小节包含70-80次试验(图1A)。每次试验持续1s,包括100ms的听觉刺激和900ms的休息期。参与者每进行五或十小节后休息几分钟。
实验任务
在1-Target实验中,当60 dB或70 dB的白噪声刺激以伪随机的方式呈现给参与者时,同步记录EEG数据(图1B)。被试被要求闭上眼睛,计算目标刺激的次数。在试验开始前告知参与者,目标刺激为70 dB的白噪声(较大声级)。刺激声级的占比为60 dB为80%,70 dB为20%。
在2-Target实验中,实验方案与1-Target几乎相同。白噪声刺激的声级分别为50 dB、60 dB和70 dB,以伪随机的方式呈现给被试(图1B)。每个声级之间有10 dB的差距,以便被试能够辨别级别的差异。在前10小节(1-10)中,目标刺激为70 dB的白噪声,在后10小节(11-20)中,目标刺激为50 dB的白噪声。在整个实验过程中,60 dB的刺激作为频繁刺激,要求被试忽略它。刺激类型的占比为50 dB为20%,70 dB为20%,60 dB为60%。
EEG检测:使用活性凝胶EEG系统采集EEG数据。根据扩展的国际10-20系统,放置64个电极,并以右耳垂电极为参考,测量每个电极与其的电压差,采样率为256 Hz。通过并行端口进行触发输入,同步测量EEG数据和听觉刺激。
实验结果
分类:使用线性支持向量机,通过二分类分析,评估oddball范式的EEG数据分类目标和非目标试验的效果。通过嵌套交叉验证计算分类准确性。
ERP分析:研究人员分析了Cz通道目标和非目标试验的平均事件相关电位(图2A、2B)。在两个实验中,目标试验在刺激开始后约400ms出现了较大的正向反应(P300)。并且,目标试验和非目标试验之间具有显著差异,主要出现在中央、顶叶和枕叶通道(图2C、2D)。基于这个结果,选择中央、顶叶和枕叶47个通道进行分类。
Half-session分析:为了检验习惯化效应,研究人员进行了half-session分析,将数据分为前半部分和后半部分。
在1-Target实验中,研究发现每个half-session的结果相似。目标刺激的平均事件相关电位ERP在前半部分为11.6 μV,而在后半部分下降到8.8 μV(图3A、3B)。在2-Target实验中,前半部分和后半部分之间差异较大。研究发现在后半部分的目标刺激事件相关电位(4.0 μV)比前半部分(9.9 μV)下降(图3C、3D)
讨论
音量控制通常需要两种指令:增大和减小。这是一个二分类或三分类问题。这类分类问题在脑机接口中很常见,因此使用脑机接口进行音量控制可能是可行的。此项研究尚未实现自动音量控制,但其研究结果证实了1-Target范式的高准确度,这表明使用脑机接口的音量控制可能适用于简单的1指令设置。然而,音量控制通常需要两个指令,因此2-Target范式将是优选的。2-Target相较于1-Target实验的准确度较低,从非目标检测目标刺激可能比从两类声音检测目标刺激更困难,这可能会影响分类的准确性,并且检测小音量目标刺激(50 dB)比检测大音量目标刺激(70 dB)更困难。由于听觉诱发电位与声级相关,因此可以更容易地检测大音量并构造用于音量减小的自动控制系统。未来的研究可以通过评估范式和分析来提高自动控制的准确性。
文献参考:
https://www.cell.com/heliyon/fulltext/S2405-8440(23)11156-X
本文来自新知号自媒体,不代表商业新知观点和立场。 若有侵权嫌疑,请联系商业新知平台管理员。 联系方式:system@shangyexinzhi.com