2020-10-30 資深UI設計者
在如今大數(shù)據(jù)的時代,一些軟件會根據(jù)我們的地理位置、性別、喜好等等進行算法推薦;能夠?qū)σ欢ㄒ?guī)范的輸入,在有限時間內(nèi)獲得所要求的輸出;比如TikTok,以用戶為中心進行推薦,度很高;本文作者分析了TikTok 的真正優(yōu)勢,我們一起來看一下。
字節(jié)跳動往往被說成是一家算法公司,很多人認為, TikTok是靠算法的黑科技才取得成功的。
事實真的是這樣嗎?
eugenewei認為不是:TikTok的算法跟其他公司使用的并沒有太大的不同;TikTok最大的優(yōu)勢是它采取了對算法友好的設計模式,在自己內(nèi)部建立了一個飛輪,幫助其機器學習算法看到了優(yōu)化自己所需要看到的東西。
原文發(fā)表在其個人博客上,標題是:Seeing Like an Algorithm;篇幅關系,我們分兩部分刊出,此為上半部分。
劃重點:
在我上一篇關于TikTok的文章中,我討論了為什么它的For You Page算法是讓TikTok發(fā)揮作用的結締組織;它就是主板的總線,用來連接和關閉所有的反饋回路。
但是,在急于了解為什么各家公司都想收購TikTok的情況下,如果字節(jié)跳動把這款熱門的短視頻app拆分出來的話,圍繞著它的算法的炒作已經(jīng)有點被異化成那種往往被歸納為最近西方對中國科技分析的套路了。
在這篇文章中,我想討論一下TikTok的設計究竟是如何幫助它的算法表現(xiàn)得跟它一樣好的。
上次我討論了為什么FYP(For You Page)算法是TikTok飛輪的核心,但是如果這一算法不夠有效的話,那整個反饋回路就會崩潰;哪怕你對TikTok或短視頻領域不感興趣,了解一下這個算法是如何實現(xiàn)性也很重要,因為各行各業(yè)的公司都日益面臨著核心優(yōu)勢是機器學習算法的競爭對手的競爭。
我想討論的是TikTok的設計是如何幫助它的算法“看”東西的。
James C. Scott的《國家的視角》(Seeing Like a State)是那種很獨特的書,看過之后你會意識到硅谷就有那種使用(濫用)清晰性這個術語的類型。
我是在看到Venkatesh Rao的書摘之后第一次聽說這本書的,如果你不打算看原著的話,那篇書摘仍然是很好的tldr入門讀物(Scott Alexander的書評也不錯,只不過他的書評也已經(jīng)長到可以做自己的tldr );不過,我建議你還是要好好看看原著。
Scott那本書的副標題是“那些試圖改善人類狀況的項目是如何失敗的”。
這本書可以提高你對日常生活當中的各種意外后果的意識,當我們也有著偉人一般的傲慢時,不妨保持更謙卑的態(tài)度;這個世界比我們想象的要更豐富、更復雜。
比方說,Scott的討論有很多都跟我們的現(xiàn)代社交網(wǎng)絡巨頭的某種傲慢感有關;這些占主導地位的應用的目的就是要提高自身用戶群的清晰性,其中包括促進互動、防止用戶流失并最終提供定向廣告;反過來,這又導致他們的母公司陷入到錯綜復雜的問題之中,至今都未能擺脫困境。
不過這是需要另行討論的話題了;Scott關注的是民族國家如何用簡化的抽象在概要的層面 “看清”自己的公民,而我想討論的是TikTok的app設計是如何讓它的算法“看到”有效地執(zhí)行匹配工作所需的所有細節(jié)的——這篇文章討論的則是是應用和服務在設計時最大限度利用機器學習新模式。(我知道,這種討論有點諷刺意味,因為這種“看法”有可能被塑造為另一種決定用戶看法的看法,一種美國的科技公司只能作壁上觀的看法。)
近年來,至少在像我這樣的門外漢看來,我們意識到,只需要通過把訓練的數(shù)據(jù)量增加幾個數(shù)量級,機器學習就可以取得很大程度的進步;也就是說,就算算法本身跟幾年前沒有太大的不同,僅通過在更大的數(shù)據(jù)集上對其進行訓練,人工智能研究人員就能取得像GPT-3這樣的突破(GPT-3暫時給科技Twitter們帶來了高潮) 。
當大家說TikTok的算法是取得成功的關鍵時,很多人會把某些神奇的代碼段看作是公該司的秘密武器。
俄羅斯當代后現(xiàn)代主義作家Viktor Pelevin說,所有的現(xiàn)代電影都是同一個主角:一個裝滿錢的公文包;從《死吻》的放射性物質(zhì)公文包,到《低俗小說》里面的那個類似的里面金光閃閃的、不知道裝著什么的公文包;從《魔頭對捕頭》(The Formula)的創(chuàng)世紀方程,到大衛(wèi)·馬梅特(David Mamet)的《西班牙囚犯》(The Spanish Prisoner)里面的秘密的金融處理,我們長期以來一直對有魔力的麥格芬(McGuffin,推動情節(jié)發(fā)展的對象或事件)感到癡迷。
最近幾周,對TikTok算法的討論已經(jīng)把它提升成了類似的東西,這個算法就好像是《奪寶奇兵》系列電影(如《法柜奇兵》、《圣戰(zhàn)奇兵》…)里面那些神秘的考古文物一樣。
但是這個領域大多數(shù)的專家的態(tài)度不會是這樣,他們不相信TikTok在機器學習推薦算法方面取得了迄今為止我們所不知道的進步;實際上,大多數(shù)人會說,TikTok的做法大概跟別人的解決問題方法無異。
但是要記住的是,機器學習算法的有效性不僅僅取決于算法,還要取決于利用某些數(shù)據(jù)集訓練過后的算法;GPT-3也許并沒有什么新鮮,但是通過接受大規(guī)模的數(shù)據(jù)訓練,以及設置大量的參數(shù),其輸出往往令人驚訝。
同樣地,基于自身數(shù)據(jù)集訓練過的TikTok FYP算法,在將視頻與認為該視頻有趣的人進行匹配方面非常準確有效(而且,同樣重要的是,在不向那些不認為視頻有趣的人推送方面也很有效) 。
有些領域,比方說文本,可以輕松獲得大量訓練得很好的數(shù)據(jù);比方說,要想訓練出像GPT-3這樣的AI模型,你可以到互聯(lián)網(wǎng)、書籍等上面找到大量可用的文本集;如果你想訓練視覺AI,可以在網(wǎng)上和各種數(shù)據(jù)庫里面找到大量照片;訓練仍然很費錢,但是至少你手頭有足夠的訓練數(shù)據(jù)。
但對于TikTok (或者抖音)來說,它那擅長推薦短視頻給受眾的算法可就沒有公開可用的這么大規(guī)模的訓練數(shù)據(jù)集了。
去哪里可以找到模因、小孩跳舞、對口型、可愛的寵物、推銷品牌的網(wǎng)紅、士兵越障訓練、小孩模仿品牌等內(nèi)容的短視頻呢?就算你有這樣的視頻,又該去哪里找到關于大眾對此類視頻感受的可比數(shù)據(jù)呢?除了Musical.ly的數(shù)據(jù)集以外(主要是美國喜歡玩對口型的青少年),這樣的數(shù)據(jù)并不存在。
這是一個獨特的雞生蛋還是蛋生雞的問題,如果沒有這款app的的攝像頭工具和濾鏡,以及拿到版權的音樂剪輯的話,TikTok的算法需要訓練的那種視頻就很難創(chuàng)建。
那么,這就是TikTok設計的魔力所在:app會激發(fā)和促進視頻的創(chuàng)作與瀏覽,算法然后用這些視頻進行訓練,再反過來激發(fā)和促進視頻的創(chuàng)作與瀏覽,形成反饋回環(huán)。
為了讓自己的算法發(fā)揮最大的效用,TikTok成為了自己的訓練數(shù)據(jù)源。
要了解TikTok是如何做出這么強大的學習飛輪,我們需要對它的設計進行深入研究。
關于科技的UI設計,主導的思想流派(至少是我成長的過去二十年里)關注的重點是消除用戶所做事情的摩擦,并讓他們在此過程中感到愉悅;其設計目標是優(yōu)雅,什么是優(yōu)雅:優(yōu)雅就是直觀、巧妙,甚至時尚。
也許沒有一家公司比蘋果把這種設計風格體現(xiàn)得更加淋漓盡致,巔峰狀態(tài)下的蘋果總能把自己的軟硬件做出優(yōu)雅的感覺——“就是這么好用(it just works)”,但同時又很迷人,讓用戶覺得很雅致。
(蘋果控制風格的名聲就沒那么光彩了——手機、筆記本電腦不可替換的電池,目前有關應用商店規(guī)則的爭論)在發(fā)布新品的主旨演講時,展示一塊硬邦邦的鋁塊是如何變成嶄新的MacBook Pro機身的視頻的理由是什么?
因為聽到工業(yè)激光把那塊鋁雕刻成一體化機身時發(fā)生的聲音很性感?然后,當你在咖啡店用那臺筆記本電腦敲擊一封電子郵件時,在你的潛意識里,有關那段視頻的一點殘留的記憶里面會不會讓你的多巴胺受到一點點的觸動?
這種以用戶為中心的設計模式在這么長時間以來一直占據(jù)著主導地位是有原因的,尤其是在消費類技術里面。
首先,這的確有用——蘋果的市值最終超過了2萬億美元(還記得假冒的Sean Parker說過十億美元很酷嗎?那還是十年前,現(xiàn)在十億美元不再是金牛了,財富的量級在飛速發(fā)展。)
此外,我們生活在大規(guī)模網(wǎng)絡效應時代,應用了Ben Thompson的聚合理論并獲得大量用戶群的科技巨頭,可以在他們所參與的市場當中發(fā)揮出不可思議的杠桿作用——要先做到這一點,最佳的辦法之一就是設計出能比競爭對手更好地滿足用戶需求的產(chǎn)品和服務。
長期以來,這種設計流派一直占據(jù)著主導地位,以至于我?guī)缀跬浟诉^去時代慣常采用過的一些蠻不講理的軟件設計了。(不要把它跟野獸派設計混為一談,后者其實就像它在建筑方面的表親一樣,在設計上是相當美的。)
但是,如果要想最大限度地服務好用戶的關鍵要取決于對機器學習算法的訓練呢?如果這個ML算法需要龐大的訓練數(shù)據(jù)集該怎么辦?在機器學習方興未艾的時代,這日益成為關鍵的設計目標。
在考慮如何設計app時,你日益必須考慮怎么才能最好地幫助算法去“看”——為了最大限度地服務好用戶,請先服務好你的算法。
TikTok讓我著迷,因為不管是意外還是有意而為之,這都是一個為了盡可能多地給自己的算法提供有用信號的現(xiàn)代app的典范——這就是我所謂的算法友好型設計的范本。(我曾經(jīng)想過把它叫做以算法為中心的設計,但覺得這種說法有點過頭了;一個幫助算法看見東西的設計到頭來仍然是為了給用戶提供盡可能好的體驗。)
我們?nèi)匀豢梢哉J為這只是以用戶為中心的設計的一種變體,但是對于那些大量采用機器學習算法組件進行產(chǎn)品開發(fā)的團隊來說,明確地承認這一點也許有用;畢竟,當產(chǎn)品經(jīng)理,設計師和工程師開會討論app設計時,算法是不會出席的;但是,對算法的訓練需求必須得到體現(xiàn)。
James Scott在談到《國家的視角》,談到了城市設計等領域的巨大變化,比如讓土地面積和業(yè)主數(shù)量對征稅者“清晰可見”;TikTok的設計使得它的視頻、用戶和用戶首選項對For You Page算法清晰可見;這種app設計履行了它的主要職責之一:“像算法一樣看東西”。
我們不妨仔細看看,TikTok打開后就是“For You Page”頁面,然后直接進入視頻。這就是它的樣子。
這個是到目前為止有史以來最熱門的TikTok視頻,截止到我發(fā)布這篇文章時,它的34.1M個點贊可能已經(jīng)不止了;你可以看看有關這條TikTok是如何誕生的故事,看過之后你仍然會覺得這是一個充滿悖論的文化難題,但是你看過后會喜歡的。
我把這個給我侄女看了,然后我們一起循環(huán)播放了好幾十次,然后我們一起開始大喊“從M到B,從M到B”,然后一起笑了起來,這是我在這場疫情當中真正的感受不是絕望的少數(shù)幾次之一。
整個屏幕被一個視頻填滿。只有一個視頻,視頻用豎屏全屏顯示;注意,這是不能滾動的,而是分頁。視頻幾乎是立即自動播放(接下來的幾個視頻被加載到后臺,所以輪到的時候可以很快播放出來)。
這種設計讓用戶要面對一個緊迫的問題:你對這個短視頻的感覺如何?就這個短視頻。
從視頻開始播放到現(xiàn)在,你所做的一切都是你對該視頻的感受的信號;你是不是在它還沒播放完就滑向了下一個視頻?是的話就隱含(盡管邊界是顯性的)表示你對它不感興趣。
你是不是看了不止一次,讓它循環(huán)播放了好幾次?似乎不知怎的它就吸引了你。你有沒有通過內(nèi)置的分享面板分享了這段視頻?這是正面情緒的另一個有力指標。
如果你點擊右下角旋轉(zhuǎn)的LP圖標,看了更多有著同樣背景音樂的視頻的話,就是該視頻對你胃口的進一步信號;音樂線索往往是模因的代名詞,現(xiàn)在TikTok又有了一條為你推薦視頻的軸線了。
還有,你是不是跑去看了看視頻創(chuàng)作者的個人資料頁面?你是不是看過她其他的視頻,然后還關注了對方?是的話說明你除了欣賞視頻以外,也許你還特別欣賞對方這個人。
但是,我們不妨再退后一步,看看這你還沒有看到這個視頻之前,TikTok的算法自己是怎么“看見”這個視頻的;在這個視頻通過FYP算法發(fā)送到你的手機之前,TikTok的運營團隊有人已經(jīng)看了這個視頻,并添加了大量相關標簽或標記。
這個視頻是跟跳舞有關的嗎?是對口型?還是視頻游戲?有小貓嗎?還是花栗鼠?是搞笑的嗎?主體是男的還是女的?大概幾歲?是群視頻嗎?背景在哪里?用的是什么濾鏡或視覺效果?如果里面包括有食物,是什么食物?等等,所有這些標簽都成為了算法現(xiàn)在可以看到的功能。
視頻還要在視覺AI這里處理一下,并為自己能看到的東西做出貢獻;TikTok有些攝像頭濾鏡能夠跟蹤人臉、手或者手勢,所以視覺AI往往在視頻被創(chuàng)建出來之前就被調(diào)用過了。
這個算法還可以看到TikTok所了解到的有關你的信息,你過去喜歡什么類型的視頻?有關你的人口統(tǒng)計學信息或心理學信息有哪些?你是在哪里看這個視頻的?你用的是什么類型的設備?等等,除此之外,還有哪些其他用戶跟你相似?
一、《國家的視角》 Vs 算法的視角
二、TikTok把自己變成算法的訓練源
三、以用戶中心 Vs 對算法友好
文章來源:人人都是產(chǎn)品經(jīng)理 作者:紙盒小卡車
藍藍設計( www.jghy.net )是一家專注而深入的界面設計公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的UI界面設計、BS界面設計 、 cs界面設計 、 ipad界面設計 、 包裝設計 、 圖標定制 、 用戶體驗 、交互設計、 網(wǎng)站建設 、平面設計服務