人民網(wǎng)
人民網(wǎng)>>教育

無需海量數(shù)據(jù)輸入

AI通過兒童眼睛和耳朵學(xué)習(xí)語言

2024年02月02日08:19 | 來源:科技日報
小字號

原標題:AI通過兒童眼睛和耳朵學(xué)習(xí)語言

美國紐約大學(xué)研究人員開展了一項實驗,他們通過一個孩子的眼睛和耳朵來訓(xùn)練多模式人工智能(AI)系統(tǒng),使用的數(shù)據(jù)來自孩子6個月大到兩歲生日期間的頭戴攝像頭的視頻記錄。發(fā)表在最新一期《科學(xué)》雜志上的這項研究表明,該模型或神經(jīng)網(wǎng)絡(luò)實際上可利用孩子經(jīng)歷的有限片段,學(xué)習(xí)大量的單詞和概念。也就是說,視頻隻捕捉了孩子大約1%的清醒時間,但這對於真正的語言學(xué)習(xí)來說已經(jīng)足夠。

GPT-4等AI系統(tǒng)現(xiàn)在可學(xué)習(xí)和使用人類語言,但它們從海量的語言輸入中學(xué)習(xí),遠比兒童在學(xué)習(xí)如何理解和表達語言時接受的要多。最好的AI系統(tǒng)訓(xùn)練的文本數(shù)量達到數(shù)萬億字,而兒童每年隻能收到數(shù)百萬字的文本。

由於數(shù)據(jù)存在巨大差距,研究人員一直懷疑AI的最新進展能否反映出很多有關(guān)人類學(xué)習(xí)和發(fā)展的信息。此次,研究團隊從孩子6個月大開始,到25個月大結(jié)束,每周通過頭戴式攝像機,捕獲其第一視角視頻並分析。他們共使用了超過60小時的視頻素材,包含大約25萬個單詞實例(即所傳達的單詞數(shù)量,其中許多是重復(fù)的)。這些單詞實例與孩子在說出這些單詞時所看到的視頻幀相關(guān)聯(lián),包括進餐、讀書和玩耍等各種不同的活動。

經(jīng)過訓(xùn)練后,團隊對模型進行了測試。他們向模型提供目標單詞和四個不同的圖像,要求它選擇與目標單詞匹配的答案。結(jié)果表明,該模型不但能夠?qū)W習(xí)孩子日常經(jīng)歷中存在的大量單詞和概念,還可以將它們概括為視覺實例,哪怕實例與模型訓(xùn)練中看到的完全不同。

(記者張夢然)

(責(zé)編:郝孟佳、李依環(huán))

分享讓更多人看到

返回頂部
紫金县| 山西省| 合江县| 隆化县| 温宿县| 阳春市| 合江县| 昭苏县| 商都县| 垣曲县| 乌拉特中旗| 凤山县| 沅江市| 繁昌县| 马尔康县| 磐安县| 唐海县| 五莲县| 同德县| 布尔津县| 长子县| 普洱| 庆阳市| 林西县| 龙里县| 华安县| 女性| 阳原县| 香河县| 望都县| 竹山县| 灌阳县| 桦南县| 满城县| 丽江市| 色达县| 全南县| 安陆市| 九龙县| 酉阳|