致股東信:寫在AI內容大爆炸元年 ——MWA驅動內容變革
尊敬的投資者:
大家好!
感謝各位在過去一年里對中文在線的關注、信任和支持。
多年以后,當我們回望2022年,ChatGPT應該是無法繞開的一個“歷史標記”。作為最快突破一億用戶的應用,比爾蓋茨評價這種人工智能技術的歷史開創意義,“不亞于互聯網和個人電腦的誕生”。
每一次技術革命,既會在生產力層面推動巨大變革,又會在社會層面帶來廣泛而深刻的影響。作為新一代信息技術革命的核心,在人們的學習、工作、醫療、娛樂……各種應用場景中,人工智能都正在逐步展現出顛覆式創新的生產力。那么對于內容產業而言,人工智能價值幾何?AIGC是否就是一個輔助創作工具?作家是不是要失業了?AI能寫出《三體》這樣的小說嗎?元宇宙和AI是什么關系?
中文在線向何處去?站在人工智能技術革命的風暴眼,相信各位跟我們一樣,有很多很多疑問。在對這些問題深入思考的過程中,我們越來越篤定一個判斷:隨著AI大模型的大規模、產業化落地,內容產業重塑的“奇點”已經來臨,整個行業既有的內容創作、生產效率、成本結構、IP變現、商業模式等等都會發生翻天覆地的變化。
一言以蔽之,內容產業的底層操作系統將被AI重新改寫。在這“奇點”來臨時刻,對中文在線而言,有四個戰略機遇關鍵詞至關重要。
第一個關鍵詞是科技。不止是AI,是MWA(Metaverse、Web3.0、AIGC)科技系統驅動了新一輪的內容革命。
前段時間ChatGPT爆火的時候,有人就發感慨說,元宇宙才不到一年,突然感覺就被AI給替代了。我不這么認為。
貝索斯說過一句話:一切戰略都是長期戰略。對內容產業而言,元宇宙毫無疑問是下一代的數字內容生活方式。但這是一項非常宏大、非常復雜、非常漫長的數字內容建設工程。
內容生產不足一直被認為是元宇宙發展的瓶頸。過去沒有人工智能的時候,我們只能依靠海量的人工;但現在有了AIGC,我們就相當于有了通往元宇宙世界的高速公路,有了成為“元宇宙基建狂魔”的底層技術能力。
中文在線前段時間剛剛發布了我們第一個元宇宙產品:RESTART重啟宇宙,這是以《流浪地球》為世界觀基底的國內首個科幻主題元宇宙。在這個產品中,AIGC作為一種高效的生產力工具在RESTART中落地,不僅大量運用于人物、道具、情節等的構建中,成為元宇宙內容生成的解決方案,也賦予玩家更豐富的玩法和更個性化的體驗。
AI不是替代了元宇宙,而是讓元宇宙所構想的數字生活,距離每一個人又更近了一步。元宇宙需要有AI支撐才可以構建全新的元宇宙產品。所以我一直認為,在這一輪的內容產業變革中,我們不要孤立的去看待每一個新技術,Metaverse、Web3.0、AIGC是一個整體,是一個系統,不止是AI,是MWA驅動了全新的內容革命。
第二個關鍵詞是效率。內容創作正在從“人力”時代,進入“算力”時代。
科技的每一次躍遷都會帶來產業的巨大變革,孕育出新一輪的爆發式增長。而這種變革和增長的魔法藥水背后,其實就是一種叫做“效率”的東西。
內容產業好像天然是跟“效率”是脫鉤的。曹雪芹寫《紅樓夢》“增刪十載,批閱五次”,卡梅隆從《阿凡達1》到《阿凡達2》,中間隔了12年。我們并不期望讓AI創作出《紅樓夢》《阿凡達》,但AI能不能幫助大師多出幾部傳世經典作品?
AIGC為內容生產者提供了新一代的智能化創作工具。從故事撰寫中的故事梗概、角色模擬、情節續寫,到圖文結合、視頻創作中的自主創作、一鍵生成,內容創作正在從“人力”時代,跨越式進入“算力”時代。
AIGC在單模態內容創作上帶來了效率和成本的指數級優化。通過在AI領域的積極探索,中文在線已經有3款AIGC產品落地應用。比如,AI文字輔助創作功能在旗下文學平臺“17K小說網”上線,可大幅提升創作效率;AI主播運用于有聲書生產中,已經有了明確的商業產出。
在多模態內容上,AIGC的高效生產能力將大大縮短IP的變現路徑,推動IP變現效率的指數級提升。公司海量的IP儲備大多以文字形態存在,AIGC的多模態能力作用于IP衍生孵化鏈條上,助力文字作品的有聲化、動漫化、影視化等,將極大降低IP變現、試錯的難度和成本,縮短IP從上游到下游的變現周期,拓寬IP變現的維度,最大化釋放IP價值潛能。
AIGC不止是一個“降本增效”的輔助工具,更是能擴大內容生產能力的“超級工廠”。當多模態AI創作日趨成熟,中文在線致力于創造的IP宇宙有望迎來爆發式增長,優質IP將被批量化激活,從休眠狀態轉入規模化生產,向用戶提供“更好數字生活”的使命就能加速成為現實。
第三個關鍵詞是數據。數據不是核心競爭力,高質量的數據才是核心競爭力。
都說數據是AI時代的“鋰礦”,誰掌握核心領域的數據,誰就享有在AI和數字經濟時代的“頂級定價權”。相信大家對這樣的論斷并不陌生。
構建AI的大模型有三個核心要素,一是算力,二是算法,第三就是數據。算力可以約等于GPU的數量,這一點上我們被卡了脖子。算法一定程度取決于我們AI科學家的數量和質量,短期內很難超過Open AI,所以在全球人工智能的競賽中,我們的機會點在哪里?答案是:
數據,而且必須是高質量的數據。
在中文數據上,Open AI的數據是不夠完整的。隨著中國公司自研大模型建設的推進,高質量的中文數據資源日益稀缺,占有數據、獲取數據的能力已經成為核心競爭力之一。中文在線擁有的海量優質正版數據本身就是龐大且高質量的語料庫,能夠大幅提高模型訓練效果。中文在線平臺每天還會產生數以億計的文字內容,更是源源不絕地為模型研發注入數據能源。如果加上音頻、視頻,中文在線的高質量數據已經超過了55TB。
高質量的數據有一個重要的前提,就是數據確權。數據作為AI時代最重要的“生產要素”,能夠進行流通、交易和訓練的前提,必須先要進行數據確權。今年4月國家互聯網信息辦公室發布了《生成式人工智能服務管理辦法(征求意見稿)》,里面明確規定“提供者應當對生成式人工智能產品的預訓練數據、優化訓練數據來源的合法性負責”,并要求“不含有侵犯知識產權的內容”。中文在線建立了完善的版權管理制度和內容管理制度,確保了數據的有效性。技術上基于自研的區塊鏈,使用國密算法+哈希值校驗+區塊鏈的專業手段,為版權電子數據提供存證服務,存證結果秒級上鏈、實時核驗,可為創作者快速確權。
海量的中文數據要素,加上完善的版權保護機制,也讓數據安全的主張成為現實。ChatGPT再好,中國也需要開發中國人自己的AGI(通用人工智能)。在這個過程中,我們也將與科技公司、研發機構一道,推動國產大模型的優化升級,打造自主可控的人工智能操作系統,在未來的大國競爭中,掌握AI信息和技術的主動權,在人工智能基座之上,實現產業層面的持續領先。
第四個關鍵詞是生態。只有秉持開放的態度,才能不斷突破AI的高度。
AIGC產業鏈分為上游(數據層和算力層)、中游(算法層)和下游(應用層)。在每一個層級,都有大量業界最頂尖的公司。
基于海量數據的內容優勢、應用場景的便利條件,中文在線是人工智能賽道布局最早、擁抱新技術最堅決的內容公司之一,我們一直在積極布局我們自己的AI內容產品,比如說AI創作、AI主播等等。但我們也深知,人工智能的模型研發及產業革命,不是靠買幾千片英偉達的GPU、靠一兩個公司就能實現的。只有秉持開放的態度,才能不斷突破人工智能的高度。
早在ChatGPT風行之前,我們就開始與國內頂尖的AI科技公司合作,用高質量數據資源的供給提升技術層模型的研發進度和精度,提速AIGC在垂直領域的產業化落地進程,并通過場景化驗證快速反饋迭代,建立正向循環,進一步拓展AIGC技術的應用場景。
應用實踐是AI、AIGC能否順利走向下一階段的關鍵點。中文在線將以數據和場景為核心,與國內外領先的AI公司深度耦合,構建AIGC的內容生態平臺。一個人可以走的很快,但一群人才能走的更遠。
科技,效率,數據,生態。這就是中文在線的“AI觀”,也是中文在線創造更好數字生活的“內容觀”。
硅基生命正在成為碳基生命世界的一部分。這是一個不可阻擋的趨勢。物競天擇,適者生存。一個產業的發展、一個公司的增長,就要學會擁抱這種變化。怕被人工智能替代最好的方式,就是用好人工智能。
我們現在可能無法想象和適應沒有電腦、手機、互聯網的生活,未來有一天我們可能也無法想象和適應沒有人工智能的生活。
當然,所有的變化都不會一夕而至,接下來我們還有很長一段路要走。SpaceX的星艦發射爆炸,有人說失敗,有人說成功。說失敗的人只看到了“爆炸”,說成功的人還看到了“移民火星”。讓我欽佩的是,無論外界的聲音如何,總有一群人在按照自己的節奏,一步一步篤定前行。
與我和我的團隊共勉。
再次感謝諸位相信AIGC,相信MWA,相信中文在線!與遠見者同行,我們倍感榮幸!
童之磊
中文在線董事長
2023年4月25日
2023-04-26 10:06