領先的行業(yè)專家為2023年的發(fā)展做出了預測。
網(wǎng)絡抓取和替代數(shù)據(jù)的重要性再怎么強調都不為過。在如今數(shù)據(jù)驅動的世界里,能夠獲取范圍廣泛的許多信息,對于致力于保持競爭力的企業(yè)至關重要。此外,人工智能(AI)和機器學習(ML)的增長也對網(wǎng)絡抓取的興起發(fā)揮了重要作用。而且,網(wǎng)絡抓取、替代數(shù)據(jù)、AI和ML已經(jīng)在顯著影響著社會,預計在未來幾年將延續(xù)這一趨勢。
Oxylabs AI和ML顧問委員會的四位杰出成員,包括SpaceNK數(shù)據(jù)總監(jiān)Adi Andrei、Three Thirds聯(lián)合創(chuàng)始人兼執(zhí)行官Jonas Kubilius、Reinforcement Learning Community創(chuàng)始人Ali Chaudhry和Stripe的機器學習工程師Pujaa Rajan,分別表達了他們對2023年的預測。
未被發(fā)現(xiàn)的機器學習功能
Adi Andrei是美國宇航局(NASA)前工程師和聯(lián)合利華(Unilever)數(shù)據(jù)科學家、SpaceNK數(shù)據(jù)總監(jiān)以及Oxylabs顧問委員會成員,他預計大型語言模型以及對比學習等自我監(jiān)督式機器學習方法會迎來增長。
Adi表示:“NLP的大型語言模型(例如BERT、GPT和衍生產(chǎn)品)將持續(xù)改進,其用途也將日益普遍。而且,一個預先訓練的模型將能夠幾乎不經(jīng)修改就用于許多功能(情緒分析、總結、字義消歧,等等)。”
Adi還預計對比學習會受到更多重視。他解釋說:“其目的是在類似和不類似的樣本之間進行對比,學習數(shù)據(jù)的表現(xiàn)形式。轉換器、文本轉圖片程序和擴散模型需要大規(guī)模數(shù)據(jù)集,并且大型模型的監(jiān)督式預先訓練很昂貴。自我監(jiān)督式對比學習可用于利用未標注的數(shù)據(jù),以便高效地預先訓練大型模型。”
Adi還補充說:“此外,對比搜索是一種相關的技術,它能夠在用于文本生成任務時顯著提高大型語言模型的輸出。”
成為盈利產(chǎn)品的內(nèi)容生成技術
Jonas Kubilius是AI研究人員、Marie Sklodowska-Curie校友、Three Thirds聯(lián)合創(chuàng)始人兼首席執(zhí)行官以及Oxylabs顧問委員會成員,他預計Stable Diffusion、GPT-3、GitHub Copilot和其他內(nèi)容生成技術會加快演化成為盈利產(chǎn)品,而被現(xiàn)實世界應用的開發(fā)人員和內(nèi)容作者所使用。他補充說,多模態(tài)模型會受到更大關注,這些模型可以處理多個任務的文本、圖片、音頻和其他輸入。
Jonas表示:“AI將從用于分類等靜態(tài)任務轉變?yōu)橛糜谡Z言模型驅動的交互式工作流程,幫助人們更高效地執(zhí)行其任務。”
近年來,人工智能(AI)在生物科技行業(yè)的采用率也日益提高。Jonas認為,生物科技行業(yè)采用AI有助于提高藥物研發(fā)的速度和準確度,最終惠及患者和整個醫(yī)療保健系統(tǒng)。
Jonas補充說:“我相信,AI在生物科技行業(yè)的采用率將保持加速提高,不僅惠及藥物研發(fā),更有助于我們更好地理解細胞生物學。”
AI應用將取代Google
Ali Chaudhry是倫敦大學學院(UCL)研究生助教、Reinforcement Learning Community創(chuàng)始人、Emeritus的人工智能和機器學習課程主任、Infini8AI技術顧問以及Oxylabs顧問委員會成員,他相信歐洲、美國、英國和加拿大等地針對AI驅動的工具所涌現(xiàn)的各種監(jiān)管將在來年更趨嚴格并繼續(xù)實施。
Ali表示:“通過Dall.E和Stable Diffusion這樣的工具在AI生成的內(nèi)容(文本和圖片)基礎上構建的應用數(shù)量會激增。開源Stable Diffusion對AI社區(qū)會帶來怎樣的影響,這是個頗為有趣的事情。”
在機器人領域,AI和NLP最近受到越來越多的關注,產(chǎn)生了出色的成果。例如,OpenAI是一家專注于AI領域的研究機構和技術公司,打造了著名的ChatGPT作為其項目之一。該技術允許機器人理解并回應人類語言,帶來更自然、更接近人類的交互。
Ali補充說:“我預計ChatGPT會在許多方面取代Google,而OpenAI將憑借這款產(chǎn)品成為科技巨頭。探索它對教育、醫(yī)療和個性化軟件的影響,會是一件很有趣的事情。它將在許多方面為我們的社會帶來革命性的變化。”
AI驅動的應用的更多用例
Pujaa Rajan是Stripe機器學習工程師以及Oxylabs顧問委員會成員,他預計生成式AI將繼續(xù)產(chǎn)生更多應用,并得到更多采用。
Pujaa提到:“2022年,我自己對GitHub Copilot感到十分興奮,它由OpenAI Codex驅動,我每天都會使用它。這是行業(yè)首創(chuàng),所以我預計2023年會有更多改進,相關技術領域也會出現(xiàn)更多競爭產(chǎn)品。”
Pujaa還補充說:“就在同一年,我們還看到,使用Stable Diffusion的Lensa為社交媒體創(chuàng)建照片和內(nèi)容。2023年,我認為作家、插圖畫家等人會采用這款工具。”
