智快網 - 新科技與新能源行業網絡媒體

          2024年AI評測新風尚:從“史密斯吃面”到游戲對戰,誰更接地氣?

             發布時間:2025-01-01 13:11 作者:馮璃月

          在人工智能技術的飛速發展下,一個令人啼笑皆非的現象悄然興起:每當有新的視頻生成器問世,網絡上總會出現一段威爾·史密斯享用意大利面的視頻。這一場景,似乎成了新技術試金石,用以檢驗AI能否以假亂真,重現史密斯大快朵頤的瞬間。TechCrunch對此進行了詳細報道,指出這一現象已超越了簡單的網絡迷因,成為了衡量AI視頻生成能力的非正式標準。

          有趣的是,史密斯本人也于二月通過Instagram回應,親自模仿了這一場景,加入了這場由AI引發的網絡狂歡。但這僅僅是2024年人工智能領域眾多奇特“民間”評測標準中的一個縮影。早前,一位16歲的開發者創建了一款應用,讓AI操控《我的世界》游戲,以此測試其建筑設計的智慧。同時,英國一位程序員也搭建了一個平臺,讓AI在“你畫我猜”和“四子棋”等游戲中展開對決,進一步探索AI的娛樂潛能。

          盡管人工智能領域不乏專業的性能測試,但這些略顯古怪的測試方式卻意外走紅。原因在于,許多專業的AI基準測試對于普通大眾而言,顯得過于深奧難懂。企業常常強調AI在解決奧林匹克數學難題或博士級別問題上的能力,然而,大多數人使用聊天機器人的目的,僅僅是進行日常對話或回復郵件,這些高深的測試與他們的實際需求相去甚遠。

          即便是行業內廣泛采用的評測方法,也并非盡善盡美。以備受關注的“聊天機器人競技場”為例,該平臺允許網絡用戶對AI在特定任務上的表現進行評分,如開發網頁應用或生成圖像。然而,參與評分的用戶大多來自人工智能和科技行業,他們的投票往往基于個人偏好,缺乏代表性,這使得評測結果的公正性和普適性受到質疑。

          相比之下,“四子棋”、“我的世界”以及“威爾·史密斯吃面條”等另類基準測試,雖然缺乏嚴謹性,卻因其娛樂性和易理解性而廣受歡迎。當然,這些測試也存在局限性,AI在某一任務上的出色表現,并不能直接反映其在其他任務上的能力。例如,能夠完美生成“威爾·史密斯吃面條”視頻的AI,未必能準確生成漢堡的圖像。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          亚洲A∨精品一区二区三区| 自拍偷自拍亚洲精品播放| 国精品午夜福利视频不卡| 九九久久国产精品| 亚洲日韩av无码| 国产精品va无码二区| 国产乱码精品一区二区三区香蕉| 91午夜精品亚洲一区二区三区| 无码人妻精品一区二区三区夜夜嗨 | 国产精品无码一区二区三级| 精品久久久无码中文字幕天天| 日韩成人免费视频播放| 国产av永久精品无码| 国产精品久久久精品三级| 国产精品爽爽va在线观看无码| 热re久久精品国产99热| 精品av天堂毛片久久久| 国产香蕉九九久久精品免费| 亚洲a∨无码精品色午夜| 中文字幕久久久久久精品| 模特私拍国产精品久久| 精品国产一区二区三区香蕉| 国产精品视频男人的天堂| 国产亚洲精品VA片在线播放| 69久久夜色精品国产69| 日韩免费精品视频| 99re最新在线精品| 狠狠精品干练久久久无码中文字幕| 香蕉久久丫精品忘忧草产品| 亚洲国产精品网站在线播放| 日韩精品成人无码专区免费| 国产乱码精品一区二区三区| 麻豆国产精品一二三在线观看 | 国产亚洲日韩在线a不卡| 日韩高清在线免费看| 色老成人精品视频在线观看| 一本久久a久久精品综合香蕉| 亚洲精品线路一在线观看 | 亚洲国产精品yw在线观看| 精品国产鲁一鲁一区二区| 国产精品久久新婚兰兰|