【我們想讓你知道】
生成式AI熱潮席捲全球,2024年更被視為AI元年,各類型生成式AI工具紛紛出爐。微軟公司6月表示,台灣84%知識型工作者使用生成式AI工具,作為日常工作輔助,企業領導人也日漸重視AI技能,幾乎各個年齡層工作者都會藉由人工智慧加快工作流程,例如藉由AI工具產生信件、文案草稿,或是摘要會議或信件內容重點。《網路溫度計DailyView》透過《KEYPO大數據關鍵引擎》輿情分析系統,統計整理十大AI工具,幫助你工作效率加倍、創意無限!
撰文:陳宣懿
NO.10 文心一言
文心一言是百度推出的生成式AI工具,可以執行文本生成、問答系統、內容創作、翻譯等多種任務,且支持多語言處理。但由於文心一言開發商是中國公司,當測試提問有關中國當局嚴格監管的敏感話題,例如詢問中共領導人習近平對中國的貢獻等問題,以及下指令要求給習近平做首詩和生成他的肖像,文心一言卻答非所問。
百度2024年4月表示,文心一言已突破2億用戶。百度創辦人兼執行長李彥宏稱AI正在帶來一場創新的浪潮,「未來的應用程式開發將變得像拍短片一樣簡單」。有網友表示,「2億用戶?吹得太離譜了」。
NO.9 Perplexity
輝達創辦人黃仁勳曾受訪表示,「我一直在使用Perplexity,不過也很喜歡ChatGPT,我幾乎每天都會使用這兩款AI工具」。Perplexity號稱是世界上第一個對話式問答引擎,可以幫助用戶快速獲得訊息和解答各類問題,也能夠理解上下文語境,提升回應的精準度,使其成為學術研究、商業應用及個人日常使用的有力工具。
2024年9月傳出Perplexity提供限時的一年免費服務,在勾選每年計費後,輸入折扣碼「FREENEWSROOM」即可領取,有PTT網友表示,「已使用,謝謝」;但也有人回報「折扣碼已失效」、「一早起來發現被取消了」、「昨天睡前以為賺到,睡醒彷彿一場夢」。
NO.8 DALL-E
DALL-E是由OpenAI開發的圖片生成工具,能夠根據用戶提供的文字描述自動生成獨特的圖像,包含寫實風格、抽象畫風等,應用範圍廣泛,從商業設計到創意藝術,皆能透過簡單文字輸入來實現高度自訂化的圖像生成,提高了創作效率。許多工具和平台整合了DALL-E技術進行AI圖片生成,包含Microsoft Designer、ChatGPT以及Bing都有它的蹤跡。
有一名網友在臉書社團「ChatGPT 4o + Copilot and ALL AI 生成式藝術小小詠唱師」分享自己使用DALL-E的成果,有人留言回覆,「大師級作品」、「真寫實」。
NO.7 Stable Diffusion
Stable Diffusion是一款AI圖像生成工具,它可以根據用戶輸入的文字描述,生成對應的圖片,廣泛應用於藝術創作、設計等領域。Stable Diffusion基於深度學習的技術,通過訓練大量圖片數據,讓模型學會逐步去除圖像中的隨機噪點,最終生成逼真的圖像。
與其他AI繪圖工具相比,Stable Diffusion的特色在於它的開源性,這使得開發者可以根據需求自訂和優化模型,將該AI繪圖模型下載並安裝在自己的電腦上,直接使用模型進行圖像生成,而不需要連接到遠程的伺服器或平台進行處理。有網友以「跑Stable Diffusion繪圖需求 懇請推薦菜單」為題發文,有人留言回覆,「推薦拿技嘉TRX50 AI TOP,適合工作站需求用料推好推滿,就看你荷包夠不夠深」。
NO.6 Suno
Suno專注於語音和音頻處理領域,可以自動生成語音對話、音樂,甚至聲音特效,並支援多種語言和口音選項,廣泛應用於虛擬助理、遊戲開發、語音合成等多個領域。此外,Suno也能創造個性化的音頻內容,幫助創作者實現更多聲音相關的創意構想。
Youtuber Cheap於3月發文驚訝地表示,自己在Suno AI輸入關鍵字香蕉,不到10秒鐘,「它就作詞作曲、自彈自唱,寫了一首歌詞看起來超白癡,但旋律還不錯的歌」,有網友留言回覆,「你不講我還以為是迪士尼卡通主題曲」、「真的很扯,詞曲產出超級快,而且偶爾還滿好聽的」。
NO.5 Claude
Claude由Anthropic開發,具備強大的語言理解和生成能力,聲稱性能、推理、計算能力皆能超越OpenAI的GPT-4和Google的Gemini Ultra,能夠協助用戶完成各種任務,包括撰寫、回答問題、進行對話、語言翻譯和進行文本分析等。它被廣泛應用於客服、學術研究、內容創作以及企業自動化流程中。Claude開發商致力於建立可與人類安全互動的AI系統,強調AI安全。
最新上線的Claude 3在測試階段還意外展現出類似人類後設認知的能力,說出「我知道你在測試我」,嚇壞不少人,有網友表示,「驚恐指數上升」;但也有人認為,「多個AI有心智能力沒什麼不好,AI可能比很多人更善良更有溫度呢」、「新科技的進步發展令人期待」。
NO.4 Midjourney
Midjourney是一個專門生成藝術圖片的AI工具,通過文字描述來創建圖像。它能夠將用戶輸入的文本轉換為逼真的藝術圖像,涵蓋廣泛的風格和主題。該平台常用於藝術創作、設計、廣告等領域,並受到眾多創意人士的青睞。用戶不需要有繪畫技能,只需簡單的文字描述,即可生成專業水準的圖像,極大提升了創作的效率和靈感發揮。
臉書社團「ChatGPT 4o + Copilot and ALL AI 生成式藝術小小詠唱師」有不少網友會發文分享運用Midjourney等圖片生成AI工具的作品,一名網友以某位導演的電影風格為關鍵字製圖,「大家猜的出是哪位導演嗎?」有人留言回覆,「今敏」、「王家衛」;也有人表示,「很讚」。
NO.3 Sora
OpenAI發明ChatGTP後,又於2月15日推出AI工具Sora。它能夠運用先進的人工智慧技術將文字轉換為影片,使用者不需要複雜的影片編輯技能或設備,只需輸入文字,Sora即可生成長達1分鐘、高品質、多種格式的影片,包括動畫、簡報,甚至是短片,這讓它適用於各種應用場景,成為內容創作者、行銷人員和教育工作者快速製作影片的新選擇。除了可以根據文字產生影片外,Sora也可以依據靜態圖像來製作動畫。OpenAI發布以Sora生成的影片,包括在東京街頭走路的女人及珊瑚礁和海洋生物等,畫面相當震撼。有網友表示,「AI是未來趨勢,唯一支持AI」;但也有人認為,「AI 缺點是沒有溫暖,永遠不能代替手繪動漫」。。
NO.2 Gemini
Gemini是Google推出的新一代人工智慧模型,功能與ChatGPT和其他AI模型類似,Gemini能處理文本生成、數據分析、程式設計等複雜任務。它的技術基礎來自Google的先進深度學習技術,能處理文字、圖片等不同資料格式,使得Gemini在商業應用、教育輔助和創意設計等領域擁有寬廣的應用前景。
但Gemini 2月卻傳出負面新聞並因此暫時下架,其影像生成系統中的人物生成,有極度偏頗的生成結果,想要白人的圖片會遭系統拒絕,然後給你黑黃褐人,例如英國女王出現黑人與亞洲皇后等例子。對此,Google坦言,模型出了點小錯誤,會修改後再推出。有網友表示,「白宮應該漆成黑宮」、「政確AI」、「多元化不包含白人,笑死」。
NO.1 ChatGPT
ChatGPT是一款由OpenAI開發的先進自然語言處理模型,其核心目的是透過模擬人類對話,為用戶提供準確且上下文相關的回應。ChatGPT能夠理解並生成各種文字內容,適用於問答、文本生成、翻譯、創意寫作等多種應用。隨著技術的發展,ChatGPT已成為教育、商業、技術支持等領域的重要工具,為用戶提供智能輔助並提升工作效率。
蘋果開發者大會於6月11日登場,亮點包括「Apple Intelligence」人工智慧技術以及有ChatGPT加持,更聰明的Siri智慧助理。用戶不但可直接跟Siri對談,它甚至會記住對話的上下文,例如「幫我安排明天跟他會面的餐廳」,Siri會知道「他」指得是剛才用戶提到的某人,不用特別重複說一次,就像與真人聊天一樣自然。有網友表示,「很巧妙的把AI解讀成Apple Intelligent,它的行銷很不錯」。
分析說明:
本研究資料由《KEYPO大數據關鍵引擎》輿情分析系統提供,分析時間範圍為2024年01月01日至2024年10月06日,共9個月。
《KEYPO大數據關鍵引擎》輿情分析系統係擁有巨量資料,以人工智慧作為語意分析之工具,每月處理1500億以上中文資料的網路社群大數據資料庫,其內容涵蓋Facebook、YouTube、Threads、TikTok、IG、新聞媒體、討論區、部落格等網站。本調查針對討論主題相關文本進行分析,並根據網友就該議題之討論,作為本次主題分析與排序依據。
本文所調查之結果,非參考投票、民調、網路問卷等資料,名次僅代表網路討論聲量大小,不代表網友正負評價。
本文由《DailyView網路溫度計》授權轉載,原文於此
(圖片來源:Shutterstock僅示意 / 責任編輯:Vickie Chou)