国产日韩欧美视频在线_成年人免费毛片_国产精品青草久久久久婷婷_国产一级第一级毛片

您的位置:首頁 >科技 >

打破“語義壁壘” AI對藝術“下手”了

2021-02-01 22:21:49    來源:科技日報

1月初,美國人工智能公司OpenAI推出兩個跨越文本與圖像次元的模型:DALL·E和CLIP,前者可以基于文本生成圖像,后者則可以基于文本對圖片進行分類。這個突破說明通過文字語言來操縱視覺概念現在已經觸手可及。自然語言處理和視覺處理的邊界已經被打破,多模態AI系統正在逐步建立。   “數據的來源或者形式是多種多樣的,每一種都可以稱為一種模態。例如圖像、視頻、聲音、文字、紅外、深度等都是不同模態的數據。單模態AI系統只能處理單個模態的數據。例如對于人臉識別系統或者語音識別系統來說,它們各自只能處理圖像和聲音數據。”中國科學院自動化研究所副研究員黃巖在接受科技日報記者采訪時表示。

相對而言,多模態AI系統可以同時處理不止一種模態的數據,而且能夠結合多種模態數據進行綜合分析。“例如服務機器人系統或者無人駕駛系統就是典型的多模態系統,它們在導航的過程中會實時采集視頻、深度、紅外等多種模態的數據,進行綜合分析后選擇合適的行駛路線。”黃巖說。

不同層次任務強行關聯會產生“壁壘”

就像人類有視覺、嗅覺、聽覺一樣,AI也有自己的“眼鼻嘴”,而為了研究的針對性和深入,科學家們通常會將其分為計算機視覺、自然語言處理、語音識別等研究領域,分門別類地解決不同的實際問題。

自然語言處理與視覺處理分別是怎樣的過程,二者之間為什么會有壁壘?

語義是指文字、圖像或符號之間的構成關系及意義。“自然語言處理與視覺處理,都重在對不同模態數據所包含的語義信息進行識別和理解,但是兩種數據的語義表現形式和處理方法不同,導致存在所謂的‘語義壁壘’。”黃巖說。

視覺處理中最常見的數據就是圖像,每個圖像是由不同像素點排列而成的二維結構。像素點本身不具有任何語義類別信息,即無法僅憑一個像素點將其定義為圖像數據,因為像素點本身只包含0到255之間的一個像素值。

“例如對于一張人臉圖像來說,如果我們只看其中某些像素點是無法識別人臉圖像這一語義類別信息的。因此,目前計算機視覺領域的研究人員更多研究的是如何讓人工智能整合像素點數據,判斷這個數據集合的語義類別。”黃巖說。

“語言數據最常見的就是句子,是由不同的詞語序列化構成的一維結構。不同于圖像像素,文本中每個詞語已經包含了非常明確的語義類別信息。而自然語言處理則是在詞語的基礎上,進行更加高級的語義理解。”黃巖說,例如相同詞語排列的順序不同將產生不同的語義、多個句子聯合形成段落則可以推理出隱含語義信息。

可以說,自然語言處理主要研究實現人與計算機直接用自然語言進行有效信息交流,這個過程包括自然語言理解和自然語言生成。自然語言理解是指計算機能夠理解人類語言的意義,讀懂人類語言的潛在含義;自然語言生成則是指計算機能以自然語言文本來表達它想要達到的意圖。

由此可以看出,自然語言處理要解決的問題的層次深度超過了計算機視覺,自然語言處理是以理解人類的世界為目標,而計算機視覺所完成的就是所見即所得。這是兩個不同層次的任務。目前來說,自然語言處理在語義分析層面來說要高于視覺處理,二者是不對等的。如果強行將兩者進行語義關聯的話,則會產生“語義壁壘”。

AI打破自然語言處理和視覺處理的邊界

此前,OpenAI斥巨資打造的自然語言處理模型GPT-3,擁有1750億超大參數量,是自然語言處理領域最強AI模型。人們發現GPT-3不僅能夠答題、寫文章、做翻譯,還能生成代碼、做數學推理、數據分析、畫圖表、制作簡歷。自2020年5月首次推出以來,GPT-3憑借驚人的文本生成能力受到廣泛關注。

與GPT-3一樣,DALL·E也是一個具有120億參數的基于Transformer架構的語言模型,不同的是,GPT-3生成的是文本,DALL·E生成的是圖像。

在互聯網上,OpenAI大秀了一把DALL·E的“超強想象力”,隨意輸入一句話,DALL·E就能生成相應圖片,這個圖片內容可能是現實世界已經存在的,也可能是根據自己的理解創造出來的。

此前,關于視覺領域的深度學習方法一直存在三大挑戰——訓練所需大量數據集的采集和標注,會導致成本攀升;訓練好的視覺模型一般只擅長一類任務,遷移到其他任務需要花費巨大成本;即使在基準測試中表現良好,在實際應用中可能也不如人意。

對此,OpenAI聯合創始人曾發文聲稱,語言模型或是一種解決方案,可以嘗試通過文本來修改和生成圖像。基于這一愿景,CLIP應運而生。只需要提供圖像類別的文本描述,CLIP就能將圖像進行分類。

至此,AI已經打破了自然語言處理和視覺處理的邊界。“這主要得益于計算機視覺領域中語義類別分析方面的飛速發展,使得AI已經能夠進一步進行更高層次的視覺語義理解。”黃巖說。

具體來說,隨著深度學習的興起,計算機視覺領域從2012年至今已經接連攻克一般自然場景下的目標識別、檢測、分割等語義類別分析任務。2015年至今,越來越多的視覺研究者們開始提出和研究更加高層的語義理解任務,包括基于圖像生成語言描述、用語言搜索圖片、面向圖像的語言問答等。

“這些語義理解任務通常都需要聯合視覺模型和語言模型才能夠解決,因此出現了第一批橫跨視覺領域和語言領域的研究者。”黃巖說,在他們推動下,兩個領域開始相互借鑒優秀模型和解決問題的思路,并進一步影響到更多傳統視覺和語言處理任務。

多模態交互方式會帶來全新的應用

隨著人工智能技術發展,科學家也正在不斷突破不同研究領域之間的界限,自然語言處理和視覺處理的交叉融合并不是個例。

“語音識別事實上已經加入其中,最近業內出現很多研究視覺+語音的新任務,例如基于一段語音生成人臉圖像或者跳舞視頻。”黃巖說,但是要注意到,語音其實與語言本身在內容上可能具有較大的重合性。在現在語音識別技術非常成熟的前提下,完全可以先對語音進行識別將其轉換為語言,進而把任務轉換為語言與圖像交互的常規問題。

無論是DALL·E還是CLIP,都采用不同的方法在多模態學習領域跨出了令人驚喜的一步。今后,文本和圖像的界限是否會被進一步打破,能否順暢地用文字“控制”圖像的分類和生成,將會給現實生活帶來怎樣的改變,都值得期待。

對于多模態交互方式可能會帶來哪些全新應用?黃巖舉了兩個具有代表性的例子。

第一個是手機的多模態語音助手。該技術可以豐富目前手機語音智能助手的功能和應用范圍。目前的手機助手只能進行語音單模態交互,未來可以結合手機相冊等視覺數據、以及網絡空間中的語言數據來進行更加多樣化的推薦、查詢、問答等操作。

第二個是機器人的多模態導航。該技術可以提升服務機器人與人在視覺和語音(或語言)方面的交互能力,例如未來可以告訴機器人“去會議室看看有沒有電腦”,機器人在理解語言指令的情況下,就能夠結合視覺、深度等信息進行導航和查找。

關鍵詞: 語義壁壘 AI 藝術

相關閱讀

国产日韩欧美视频在线_成年人免费毛片_国产精品青草久久久久婷婷_国产一级第一级毛片

        久久久久久久久岛国免费| 午夜一区二区三区在线观看| 日韩精品一二三区| 成人免费毛片片v| 亚洲欧洲一区二区三区| 欧美性大战久久久久久久蜜臀| 久久久久青草大香线综合精品| 亚洲狠狠爱一区二区三区| 国产精品一区二区x88av| 国产欧美精品区一区二区三区| 色综合中文字幕| 久久精品一区二区三区不卡牛牛| 丝瓜av网站精品一区二区 | 天天色天天操综合| 久久亚洲精品国产精品紫薇| 偷拍自拍另类欧美| 久久久亚洲综合| 在线亚洲一区二区| 国产精品网站导航| 激情综合五月婷婷| 自拍偷在线精品自拍偷无码专区| 欧美久久久久久久久中文字幕| 中文av一区特黄| 国内不卡的二区三区中文字幕 | 日韩午夜在线观看| 一区二区三区国产豹纹内裤在线| 粉嫩嫩av羞羞动漫久久久| 亚洲激情六月丁香| 2020国产精品自拍| 欧美a级一区二区| 中文字幕欧美一| 欧美xxxxx牲另类人与| 亚洲成人精品影院| 国产日韩欧美a| 在线成人午夜影院| 天天色综合成人网| 国产精品免费视频一区| 欧美一级国产精品| 日韩黄色在线观看| 国产精品久久精品日日| 精品国产一区二区亚洲人成毛片| 麻豆一区二区99久久久久| 国产精品久久久久久久久久免费看 | 欧美精品乱码久久久久久按摩| 亚洲午夜激情av| 国产午夜久久久久| 欧美一区二区在线不卡| 日本伊人午夜精品| 综合久久综合久久| 国产日韩av一区| 丰满白嫩尤物一区二区| 91国偷自产一区二区开放时间| 亚洲日本免费电影| 91影视在线播放| 欧美精品三级日韩久久| 日韩不卡一区二区三区| 中文字幕中文字幕一区| 久久精品人人做| 懂色av一区二区三区免费看| 色狠狠av一区二区三区| 一个色妞综合视频在线观看| 欧美激情一区三区| 久久色在线观看| 国产ts人妖一区二区| 欧美午夜在线一二页| 三级影片在线观看欧美日韩一区二区| 亚洲视频在线观看一区| 中文字幕在线免费不卡| 久久亚洲精品小早川怜子| 欧美一区二区在线不卡| 韩国三级在线一区| 色妹子一区二区| 午夜精品久久一牛影视| 亚洲精品国产品国语在线app| 亚洲欧洲性图库| 国产三级三级三级精品8ⅰ区| 精品久久人人做人人爽| 成人午夜视频在线观看| 欧美精品一级二级| 国产专区综合网| 欧美天堂一区二区三区| 免费久久精品视频| 性感美女极品91精品| 亚洲chinese男男1069| 亚洲人成人一区二区在线观看| 中文字幕日韩欧美一区二区三区| 国产日韩在线不卡| 国产日韩精品一区二区三区在线| 久久这里都是精品| 精品成人私密视频| 99久久婷婷国产综合精品| 欧美一级二级三级蜜桃| 国产精品99久久久久久有的能看| 欧美裸体一区二区三区| 国产精一区二区三区| 538prom精品视频线放| 国产麻豆视频一区二区| 在线播放一区二区三区| 国产成人免费av在线| 欧美久久久久久蜜桃| 国产另类ts人妖一区二区| 制服丝袜中文字幕亚洲| 成人一区在线看| 精品欧美一区二区三区精品久久| av网站一区二区三区| 久久久国产综合精品女国产盗摄| 2023国产一二三区日本精品2022| 久久精品夜色噜噜亚洲a∨| 久久综合久色欧美综合狠狠| 国产欧美1区2区3区| 欧美激情中文字幕| 日韩码欧中文字| 亚洲激情中文1区| 婷婷成人激情在线网| 日本精品裸体写真集在线观看| 久久国产精品99久久久久久老狼 | 欧美性大战久久久| 国产a区久久久| 精品动漫一区二区三区在线观看| 久久综合成人精品亚洲另类欧美 | 国产精品国产精品国产专区不片| 最好看的中文字幕久久| 亚洲一卡二卡三卡四卡| 在线免费观看日本欧美| 国产.欧美.日韩| 国产亚洲欧洲997久久综合| 国产精品女主播av| 一区二区三区中文字幕| 天涯成人国产亚洲精品一区av| 久久99久久久欧美国产| 日韩欧美一区二区久久婷婷| 久久色在线观看| 亚洲日穴在线视频| 午夜国产不卡在线观看视频| 激情综合网天天干| 久久综合网色—综合色88| 欧美激情一区二区三区不卡 | 国产精品少妇自拍| 一区二区三区在线影院| 麻豆精品一区二区| 日韩欧美国产一二三区| 欧美韩日一区二区三区| 午夜欧美电影在线观看| 欧美精品欧美精品系列| 久久久久久久久久久黄色| 亚洲自拍都市欧美小说| 精品视频在线看| 91免费视频网址| 亚洲精品国产a| 欧美日韩国产精选| 久久久影院官网| 香蕉影视欧美成人| 欧美一区二区三区视频免费| 国产三区在线成人av| 天使萌一区二区三区免费观看| 91精品国产91久久综合桃花| 亚洲国产成人午夜在线一区| 五月天激情小说综合| 91精品国产综合久久久蜜臀图片| 欧美国产精品一区| 免费在线一区观看| 精品久久久三级丝袜| 一区二区三区在线观看动漫| 国产九色精品成人porny| 国产精品国产三级国产a| 在线观看91视频| 久久蜜臀精品av| 天堂久久久久va久久久久| 欧美成人综合网站| 亚洲精选免费视频| 国产99精品国产| 依依成人精品视频| 91精品国产综合久久香蕉的特点| 国产精品欧美综合在线| 加勒比av一区二区| 亚洲天堂网中文字| 欧美偷拍一区二区| 国产精品视频一二| 国产一区 二区| 最好看的中文字幕久久| 欧美日韩国产一二三| 国产精品福利电影一区二区三区四区| 麻豆精品视频在线观看免费| 国产欧美精品在线观看| 91久久国产最好的精华液| 久久九九影视网| 久久66热偷产精品| 18成人在线观看| 678五月天丁香亚洲综合网| 亚洲欧美视频在线观看| 成人少妇影院yyyy| 亚洲sss视频在线视频| 久久久久久毛片| 在线视频中文字幕一区二区| 国产精品丝袜一区| 国产成人亚洲综合色影视| 亚洲一区二区三区激情| 日韩免费性生活视频播放| 亚洲福利一区二区三区| 久久伊人蜜桃av一区二区|