專訪《Understanding AI》作者 Timothy B. Lee | Stratechery
Length: • 4 mins
Annotated by Jimmy Su
早安,
本週的 Stratechery 專訪對象是《Understanding AI》一書作者 Timothy B. Lee。Lee 是位難得一見的人才:一位擁有電腦工程碩士學位的記者。他曾為 Ars Technica、Vox 和華盛頓郵報撰稿,現在經營自己的 Substack,專門探討 AI 及其對經濟和社會的影響。
在這次訪談中,我們暢談 AI,以一種——容我這麼說——只有中西部人才有的方式。當前世界究竟發生了什麼,這又能說明現有模型的實際可能性為何?Lee 也投入大量時間研究 AI 監管,我很欣賞他在這方面展現的務實態度。我們還花了許多時間討論自動駕駛汽車,以及為何 Lee 看好 Waymo。
在此提醒,所有 Stratechery 的內容,包括訪談在內,都可以以 podcast 形式收聽;點擊本郵件頂部的連結,即可將 Stratechery 加入您的 podcast 播放器。
讓我們開始訪談:
專訪《理解 AI》作者 Timothy B. Lee
本訪談經過輕微編輯以提高清晰度。
主題:
經濟學家 vs. 科技人 | AI 影響 | LLM 限制 | AI 監管 | AI 泡沫? | 自動駕駛汽車
經濟學家 vs. 科技人
Timothy Lee,歡迎來到 Stratechery。
TL:嗨,謝謝邀請。
我邀請你來是因為你有個很棒的 Substack 叫做 Understanding AI,是你幾年前開始的,我想讓你在 Stratechery 分享一些見解。不過在此之前,先跟我聊聊你自己,以及你是如何走到現在的。讓我們從頭開始,你現在在華盛頓特區,你是在那裡長大的嗎?你的經歷是怎樣的?我想聽完整的故事。
TL:好的。我在明尼蘇達州長大,在明尼蘇達大學就讀,主修電腦科學。
你是個中西部人啊。
TL:是的,確實如此。大學畢業後,其實在求學期間我就對政治很感興趣,經常在網路上與人辯論。畢業後,我有個朋友在華盛頓特區的 Cato Institute 工作,是個初階寫手職位。於是我申請了那個職位,其實並沒有抱太大期望,這也不是我原本規劃的職業道路,但他們錄用了我。我想:「搬去華盛頓特區寫個一兩年政治文章應該蠻有趣的」,後來這份工作讓我開始寫部落格,然後寫部落格又轉變成了新聞工作。
我在普林斯頓待了幾年,在那裡的科技政策研究中心攻讀電腦科學研究所,後來發現我不太可能成為一名優秀的電腦科學教授,所以又回到新聞界。從那時起我一直在從事新聞工作。我曾在華盛頓郵報工作,也在 Vox 工作過,是 2014 年 Vox 創始團隊的成員之一,之後又回到 Ars Technica 工作了幾年。現在我獨立工作,去年開始經營一個叫做 Understanding AI 的 Substack。
所以你之前是在做類似「理解經濟學」的內容,叫做 Full Stack Economics,而在 Understanding AI 中,你承諾要全方位報導 AI。這是什麼意思?
TL:是的,我試圖涵蓋不同面向。有些 AI 電子報主要聚焦在技術問題上,是為程式設計師撰寫的,深入探討技術層面。我也會談一些技術,但同時也會討論政策議題。我會探討 AI 對經濟的影響,也會稍微談到文化議題,我寫過幾篇關於版權問題的文章。所以是的,我會思考不同層面。有些人關注技術,有些人思考社會影響,有些人則思考政策議題。
而你試圖將這些都串連起來。
TL:是的,我的背景其實相當多元。在 Vox 任職時,我主要報導經濟相關議題,因此對於科技如何改變社會的經濟文獻有相當深入的了解。早期我也報導過許多著作權相關的科技政策議題。我認為憑藉這樣的背景,我能夠統整不同領域對 AI 的見解。如果讀者想要全面了解這項科技的運作原理,以及它對世界造成的影響,我想我能夠很好地幫助讀者理解這些內容。
你認為這些領域各有什麼樣的盲點?無論是專注於科技的人、經濟領域的專家,或是關注社會議題的人,每個群體可能忽略了什麼?你希望用什麼方式來彌補這些缺口?
TL:我觀察到科技人士往往對經濟運作有著過於簡化、近乎漫畫式的理解。他們認為一旦我們發明了人工智慧或超級智慧,一切就會徹底改變。但經濟學家的思考方式是,智慧只是眾多屬性中的其中之一,其他還包括體能、基礎建設、自然資源等。擁有更高的智慧當然有幫助,但這可能不會改變一切。相反地,智慧的邊際效用會遞減,其他因素反而會變得更有價值。
再者,這並非我們第一次面對具有革命性的科技。我深入思考過先前的科技演進,以及「為什麼 2010 年代經濟成長緩慢,即使我們似乎擁有許多機器人?」這類問題讓我能以不同的角度來探討未來工作型態和經濟影響。至於經濟學家這一方,我認為包括我在內的經濟學家和政策制定者都沒有足夠關注當前的發展。
基本上,一方認為變革來得很快,但低估了實現所需的時間;另一方則認為什麼都不會改變,卻低估了正在發生的轉變。這在某些方面可說是完全相反的問題。
TL:是的,某種程度上,人們彼此談話都有些雞同鴨講。科技人士認為關鍵問題是「科技是否會快速變革」,他們認為答案是肯定的,因此社會影響也會快速改變。我認為這種想法有誤,因為過去也曾發生過科技快速變革的時期,確實改變了社會的某些層面,但程度遠不如預期。
另一方面,確實有人低估了這些影響。Mark Zuckerberg,或者是 Bill Gates 曾說過,人們總是高估一年內能改變的事物,卻低估十年內的改變。我認為就是這樣的情況。那些說到 2027 年一切都會改變的人可能是錯的,但到了 2034 年,很可能會出現一些重大改變。我認為我很擅長權衡這些不同的觀點。
順帶一提,你剛才提到了一個問題:無論是個人電腦還是網際網路時代,生產力提升究竟在哪裡?你認為這些改變是需要時間才能顯現?還是有大量未被衡量到的消費者剩餘?對於這個問題,你的整體看法如何?
TL:這裡有幾個重點。首先,新的通用技術要發揮效益需要一段時間,因為要獲得重大進展,往往需要重組許多其他商業流程。經濟學家喜歡用一個著名的類比來說明最初的經濟電氣化過程。他們最初嘗試做的是,把舊式蒸汽動力工廠裡那種只有一個大型曲軸的系統,改裝成用電動馬達,但這樣並沒有帶來多大的改善,因為當時電力並不便宜。
情況可以說更糟了。
TL:但在十到二十年後,人們發現:「喔,我們可以在每個工作站都裝一個小型電動馬達,這樣工廠就能更有效率了」,不過要達到這點,就必須建造新工廠,創立新企業。
我認為現在可能也出現類似的情況,在 1990 年代和 2000 年代,特別是在疫情期間,遠距工作迫使人們不得不重新思考組織運作的方式,我想這是我們現在看到生產力成長的原因之一。
但另一個重點是,我認為如果沒有電腦革命,生產力成長可能會大幅下降。我們可以看到,二十世紀初期的重大創新帶來了生產力的大幅成長,但到了五十年代、六十年代和七十年代就開始減緩,如果沒有新的突破,這種減緩趨勢會持續下去。所以能夠維持現有的生產力水準,實際上是因為我們有了新技術。因為人們總是認為經濟每年都會神奇地以 2% 的速度成長。
一定要有推動的力量。
TL:你需要新的事物,而資訊科技就是這個推動力。我認為它的效果可能不如內燃機、電力、疫苗等等的總合那麼強大。但是沒錯,它確實在維持經濟成長。不過要達到 2%、3%、4% 的成長率真的很困難,更別說某些人認為 AI 可以帶來 10% 的成長了。
你是否認同這種理論:科技最大的影響其實是造成巨大的通貨緊縮,因為它的邊際成本接近於零?即使是在生產設備時,你只是大量複製同一個產品,而這些產品都能提升生產力。這就是為什麼在 2010 年代,我們可以實施寬鬆的貨幣政策,卻直到 2021 年才看到明顯的通膨,因為資訊科技扮演了抗衡的角色。
TL:我認為這只是一小部分原因。主要還是宏觀經濟的問題。我認為整個 2010 年代的貨幣政策都太緊縮了。不過,這可能已經超出我們討論的範圍了—
對了,我們確實有點離題了。既然你說是全端,那我們就真的要談得很全面了!
TL:我認為這更多是宏觀經濟現象,因為當經濟成長緩慢時,企業就不願意投資,因此利率就會降低,這又導致經濟持續緩慢成長,形成惡性循環。要打破這個循環,我們需要大規模的刺激—雖然 2021 年的刺激措施可能做過頭了—但這種大規模刺激確實有助於回到新的平衡點。現在我們可能又走向另一個極端,通膨和利率都很高。科技確實在某些產業造成通貨緊縮,比如說現在沒人買紙本地圖了,諸如此類的情況。但經濟中的大宗支出項目是住房、交通、醫療保健、教育,資訊科技在這些領域雖然有幫助,但我認為影響很有限。
你是否相信 Baumol 成本理論?也就是說,許多服務業變得非常昂貴的原因,是因為科技已經大幅降低了許多商品的成本?
TL: 是的,確實如此。一旦出現通縮效應,並非所有東西都會貶值。剩下的是那些難以自動化的事物。因此,要維持相同的成長率變得困難,因為那些成長緩慢的部分在經濟中所佔的比重會越來越大。
AI 影響
從整體來看,你在一年半前的 2023 年 3 月開始了「認識 AI」。在這段期間,你的觀點有什麼改變?你在最初的文章中提到:「ChatGPT 令人震撼,這真的引起了我的注意。儘管我長期關注 AI,但這次它把許多事物都串連起來了。」首先,你能追溯一下你的動機嗎?「不,我要停止經濟相關的工作,專注在 AI 上。」其次,在過去這一年半裡,你的觀點有什麼改變嗎?
TL: 我當時在寫經濟相關的電子報,老實說訂閱成長並不理想。雖然還可以,但我也在尋找新的發展方向。當 ChatGPT 出現時,它的表現讓我感到驚訝,而且似乎會帶來重大的經濟影響。我本想在 Full Stack Economics 上寫這個主題,但我想,如果要認真做,就應該好好研究,做大量閱讀等等。所以我試著先暫停經濟電子報,嘗試寫 AI 相關的內容,看看情況如何,結果訂閱量增長得更快。於是我決定:「好吧,這就是我新的永久工作方向。」
這是個不錯的報導領域。
TL: 是的,確實如此。我很享受這份工作。我認為最令我意外的是,我真的很喜歡做採訪報導。我覺得這能帶來的價值在於,我可以實地觀察人們如何使用這項技術,以及它如何影響人們。我本希望能探訪更多產業,聽人們說:「看,自從有了 AI,我的職業完全不同了。人們開始做這個而不是那個,要麼大家都被裁員,要麼生產力大幅提升。」但令我意外的是,目前這樣的產業並不多。
有沒有什麼例子,或是特別突出的例外?
TL: 我最早寫到的是專業譯者。他們比較早面臨這種情況,因為 Google Translate 在五六年前就已經相當優秀了。雖然他們並沒有全部失業,但我認為他們的薪資確實受到下行壓力,必須轉向更專業的技術領域,也就是那些對風險特別謹慎的領域。
我想你說得對,他們的生產力提高了,但薪資反而降低了。這正是我們所預期的情況。
TL: 沒錯,這是最明顯的案例。我現在正準備要對程式設計產業做一些採訪報導,因為我認為這確實是一個案例,GitHub、Copilot 等工具明顯提高了程式設計師的生產力。我特別想了解入門級程式設計師的情況。我聽說現在要找到入門級工作變得更困難了,公司也不太願意招聘。我對此有些存疑,但我想和相關人士談談,因為這似乎是有可能發生的情況。
我很期待那篇文章,因為你在 Twitter 上看到很多軼事,但很難真正理解「這是不是一個大趨勢?」。你也提到現在有很多人選擇這類科系,是不是現在供給太多了?我很好奇這背後的動態是什麼。
TL: 再說一次,這又是一個宏觀經濟真的很重要的案例。我的意思是,我們經歷了較高的利率,而科技業也經歷了比整體經濟更嚴重的小型衰退。所以如果現在找工作變得更困難,可能就是這個原因。老實說,我也不確定該如何具體分析這個現象,也許最後會寫成一篇文章,但現在還說不準。不過無論如何,我會盡量從中找出一些線索。
然後我認為有一些職業,比如客服相關的工作,很多公司都在開發聊天機器人來處理基礎的技術支援需求。我還沒看到這方面有太大的影響,但我相當確定這些改變即將來臨。是的,大概就是這樣。我確定還有其他例子,但是我原本期待看到更多正面的報導,像是「事情發展得很快」之類的。隨著時間推移,我越來越清楚地意識到我之前說過的:即使是非常優秀的科技,也需要五到十年的時間才能真正落地。
這是不是說明了一個現象:正因為這項技術如此驚人,反而證明了它的影響力,因為越具有變革性的科技,實際上需要越長的時間才能展現成果?我很喜歡電動引擎這個例子。重新改造工廠需要時間,有人必須思考這個過程,而且現有的方式已經投入了大量成本。所以,是不是可以說,目前看似沒有太大變化,反而證明了這項技術的重要性?還是說這樣的分析有點過於牽強?
TL: 我認為這個問題在於,就這類發展而言,它的採用速度其實算快的。我想在許多職業領域中,人們的效率已經提升了幾個百分點,因為只要有人在做程式設計之類的工作就會感受到。比如幾個月前,我需要寫一個簡單的 Perl 腳本來處理某件事,這原本需要花我幾個小時,但現在只花了十分鐘。
所以在整體經濟層面上,我認為人們在各種小細節上都變得更有效率了,但有人宣稱它會帶來巨大的改變,說什麼「它會取代一半的勞動力」之類的,這種情況不可能在短短十到二十年內發生。因為即使這項技術能立即完美運作,企業也會趨於保守。重新調整各種流程都有其必要性,所以是的,我們現在確實看到了一些影響,但如果要說重大影響,假設真的會發生的話,我認為那還是未來的事。
當 AI 真正產生重大影響時,你認為這是否會涉及人口結構的問題?就像資訊科技的例子一樣。第一代使用電腦的人,最早期那批是真的想用電腦的人。他們看到電腦能提高生產力,但他們的同事都說:「看那邊那個魯蛇」,而且都是不情不願地使用。但下一代進入職場時,他們已經習慣使用電腦了。SaaS 的發展某種程度上可以說是千禧世代進入職場的故事,而不僅僅是科技變革的故事。你覺得這個說法有道理嗎?
TL: 是的,完全同意。我可能應該多跟年輕人交流,因為這點我也想到過。人們經常問我:「你用什麼 AI 工具?」,答案基本上是沒有。我是說,我經常使用 ChatGPT,有時候確實能顯著提升效率,但也就這樣了。這可能是因為目前的技術還不足以產生重大影響,但也可能是 25 歲的年輕人已經在用各種令人驚豔的方式運用它,而我可能太老了,難以重新調整工作方式,所以我需要多跟人交流來了解這點。
相信我,我想我們年紀差不多,我完全能理解你的想法和感受。話說回來,我記得那間大公司——Wikipedia 是在我讀大學時出現的,當時所有教授和老師都禁止使用它。但你很快就會發現,使用 Wikipedia 的關鍵在於它的參考來源。你先查 Wikipedia,然後透過它提供的連結找到所有原始資料,這樣就能取得第一手資料。我覺得 ChatGPT 就像是這個概念的進階版,特別是搜尋功能,當它提供資料來源時,就好像是打造了一個包羅萬象的 Wikipedia,在知識廣度這方面,確實很難找到能與之匹敵的工具。
TL:沒錯。就像使用 Wikipedia 一樣,你必須聰明地運用它。不能盲目相信所有內容都是準確的,一定要自己查證。但我確實發現,每當我需要列出某個類別的清單,比如想知道某個領域有哪些公司時,在 Google 上搜尋就很麻煩。反之,如果你問 ChatGPT:「這個類別已有這三家公司,請列出更多相關公司」,它就能提供更多資訊。類似這樣的應用場景很多。所以,我不會說永遠不要用它,或說它沒有用。它確實很有用,但每週的工作效率可能只會提升百分之一到二,而不是帶來革命性的改變。
那麼在這個脈絡下——我稍微偏離了原本要問你關於你的文章的話題,轉而討論我的另一篇文章——你認為 AI 會如何發展?我的理論是,正確的參考框架不是手機、網際網路,甚至不是個人電腦,而是要回溯到大型主機時代,以及後端工作的自動化,像是會計和 ERP 這類的應用。有趣的是,人們認為「AI 會先提升我們的生產力,然後才會取代工作者」。但依照這個觀點,工作者被取代的部分反而會最先發生,而且是很容易就能替換的工作,決策者可以進行成本效益分析。他們會考慮:系統出錯的頻率如何?出錯的成本是多少?相較於同樣會犯錯的人類,這個平衡點在哪裡?我們稍後會談到自動駕駛車。但如果能從上而下地思考人為事故和自動駕駛事故的比較,我們就能更快實現自動駕駛。雖然整體經濟體系無法這樣操作,但在公司內部是可行的。所以這會是第一波浪潮,你對這個論點有什麼看法?
TL:我認為你說得對。但這確實很難說,AI 是個太廣泛的類別,就像在問「軟體是如何被引進經濟體系的?」。我確實認為,有一類擁有大量資料集和明確既定流程的公司,這是引進 AI 的自然途徑。所以沒錯,這肯定會是第一波浪潮的一部分。但還會有許多其他應用,就像你提到的自動駕駛車,這是另一個正在推進中的 AI 應用。所以我認為會有許多應用同時並行發展,但這類既有的應用確實會是最早的落地場景之一。
LLM 的侷限性
再回到你過去十八、二十個月的觀察,你認為 AI 是否已經遇到瓶頸?你其實在去年十二月 Gemini 發布時就開始公開思考這個問題,特別是考慮到 Google 的優勢,你對結果感到有點失望。當時你不確定,這是否是 Google 特有的表現問題,或者我們是否已經用 GPT-4 達到了極限?十一個月過去了,你對當時那篇文章的評價如何?
TL: 我觀察到的是,我們一直聽說 GPT-5 即將問世——
但它目前還沒出現。
TL: 一直都在說會有新的大型模型即將發布,但至今仍未現身。我沒有足夠的內部消息來源了解這些公司究竟在做什麼。也許他們還在開發中,下個月就會推出讓我大開眼界的成果,但隨著時間一天天過去,我越來越持懷疑態度。特別是我們看到另一個趨勢:這些公司正在發布一些規模較小的模型,而它們的表現卻幾乎可以媲美大型模型。
某種程度上,我對 o1 印象深刻,但 o1 的做法有所不同。它不是透過擴大模型規模,而是增加推理時的運算量。在某些方面,它確實表現得更好,但整體而言並沒有突破性進展。
所以我目前的假設雖然還不成熟,但我認為現有的 LLM 架構似乎遇到了某種瓶頸,我們正在各個層面碰觸到這個極限。當然,我們已經有了更優秀的多模態模型,能夠即時處理語音和圖像,這些都是新的突破。但就整體推理能力的提升而言,自從 2023 年 3 月 GPT-4 發布以來,似乎就沒有重大突破了。我不想做出太武斷的預測,因為說不定下個月就會有令人驚艷的發展,但每過一個月,我就更加好奇到底發生了什麼。
你認為這個限制是來自於資料、運算能力,還是 transformer 架構本身的根本限制?
TL: 我猜測這是 transformer 架構的根本限制。主要問題在於,transformer 架構要求所有模型狀態都儲存在個別單詞的向量中,並且永久保存整個上下文,沒有摘要和抽象化的過程。想想我們的人生經驗,回想十年前發生的事,你不會記得每句話、每個細節,而是會有一個抽象的記憶,比如「我記得 2014 年住在某個地方,做著某份工作」,學到的東西會以某種方式進入大腦,而且是以一種有條理的方式組織的。但 LLMs 就是缺乏這種能力。
如果考慮到人們期待未來會有一個 LLM 能當個人助理,陪伴你的職業生涯,了解你的所有習慣,幫你安排所有約會等等。但就我這個資訊工程師的角度來看,目前這種記住每個 token 並對整個語料庫進行注意力運算的架構,沒有辦法進行綜合、抽象,也無法忘記不重要的事情,這樣的方式似乎不太可行。
我還注意到它們在空間推理和某些算術運算方面表現得很差,這再次說明,空間推理是另一種組織資訊的方式,可能單純用詞向量無法實現。我認為我們需要的是某種獨立於詞向量之外的記憶系統,而且需要更多的結構性。我不知道該如何實現,我也不會是那個發明這個東西的人,但我認為要達到更高層次的抽象推理能力和更長的上下文理解,這個方向是必要的。
從人腦的角度來思考這件事很有趣。雖然我們現在只是在推測和理論化,但關於 LLMs 最基本的運作方式,我一直覺得很引人入勝的是,就像我們現在錄製這個 podcast,並不知道接下來要說什麼,對吧?在我們說話和溝通的過程中,確實存在一個超快速的下一個詞預測的部分。但同時在我們的記憶中,有許多清理演算法在運行,形成啟發式的過程,這並不是如你所說的記錄我們經歷過的每一個細節。它在挑選精華,將它們融合在一起。你可以看到,實際的輸出過程中確實「有些東西在那裡」,但關於記憶的保留和發展過程,我想這才是你真正想表達的重點。
TL:我從另一個角度來看,LLMs 和目前大多數的 AI 演算法在訓練和推理之間劃分了一道明顯的界線。它們會透過吸收巨量的資料集,從中學習各種抽象概念,然後當你詢問它在訓練中學到的內容時,它可以進行抽象推理。但如果你引入一組全新的概念——讓我舉個例子,有一個叫做 Chess960 的遊戲,不同於傳統西洋棋的擺法,這個由 Bobby Fischer 發明的遊戲會打亂棋子的位置。我相信如果讓 ChatGPT 下這個遊戲,它的表現會比標準西洋棋差得多,因為它只記住了「這是標準的走法,這是標準棋局中的有利位置」,但它缺乏形成新抽象概念的能力,無法說「好,現在我已經下了幾盤棋,我理解了這個變體西洋棋中各個棋子的角色」。相比之下,人類顯然是持續不斷在學習的,上週學到的東西就會成為未來的「訓練資料」。所以我認為,我們需要能在推理過程中進行「訓練」的 AI 系統,而不是這樣明確的區分,因為人類在一生中都在不斷學習。
所以就資料、運算能力、演算法這三個要素來看,你的重點其實是放在演算法上。我們需要新的方法來實現這個目標。
TL:是的,這是我的猜測。
我認為這個想法很合理。另外一個有趣的觀點,是我一個朋友告訴我的:這些模型已經吸收了網路上所有的內容,這很驚人,但網路上的內容本質上都是思考過程的最終結果,你必須經過思考才能將內容輸入文字框並發布到網路上。即使像 Google 的觀點,YouTube 的影片庫可能包含更多資訊,因為有所有的視覺內容。但即使如此,這些內容都是經過編輯過程的結果,背後還有很多其他內容,事實證明,網路上的所有資料實際上只是產生這些內容所需的全部思考過程中很小的一部分。
TL:沒錯,而且許多最有價值的資訊都不在網路上。以任何產業來說,比如製造火箭的細節,SpaceX 內部可能擁有比公開網路上更有價值的文件,也許 SpaceX 可以建立一個專門的模型來處理這些。但認為我們可以建立一個在所有領域都比人類更優秀的通用模型,這種想法低估了許多特定任務所需的知識有多麼珍貴和稀少。
你讓我想到另一個例子。顯然,AI 技術的一個關鍵組件就是晶片,當你來回思考晶片的問題以及「台積電的優勢是什麼?」時,你總會回到一個結論:這當中存在許多默會知識,你不能就這樣跨越多個製程,因為有些東西必須循序漸進地學習。如果貿然跨越,特別是在擴大規模時,你會遇到意想不到的障礙,因為有些問題只有在實作過程中才能解決。這種解決問題的過程從來沒有被確實記錄下來,也無法被記錄,因為這就是學習過程中固有的特性。當你提到火箭的例子時,我突然意識到,在 AI 的脈絡下,這是個相當諷刺的例子,說明了「默會知識對推動 AI 發展確實非常重要」,但似乎還沒有人完整地闡述這個觀點,這可能就是 AI 的一個根本限制,因為它無法獲得我們所需要的默會知識。
TL:是的,完全同意。我認為那些對快速突破持樂觀態度的人,他們認為可以模擬這些東西,但現實世界太過複雜,你不知道起始條件是什麼,也不知道世界是如何運作的。所以,我認為想要找到捷徑來取代人類的做法是不太可能的。人類的方式就是:進行實驗、嘗試、觀察結果,然後再次嘗試。如果這些模型沒有來自這類實驗的資料,它們就不可能比人類更聰明。
你之前似乎對 o1 印象深刻,你稍早也提到過。現在過了一兩個月,你的熱情是否有所減退?還是你認為這確實是個突破性的進展?你現在的評價如何?
TL:我想說的是,從十年前的電腦到人類的能力,這個差距非常大。這次是自 GPT-4 以來最大的進步,但這只是在整個進程中前進了 5% 或 10%,而不是 80%。是的,要衡量某個進展有多令人印象深刻確實很困難,因為我仍然對這些技術的存在感到驚嘆。所以某種程度上,我確實對它印象深刻,但我認為人們低估了在達到任何可稱之為 AGI 的東西之前,我們還需要走多少步。
這其實與全端開發的概念有關,就現有的技術而言,還有許多產品待開發,即使這就是全部,也足夠支撐十到十五年或更長的發展。在我看來,我們現在已經擁有讓 AR 成為可能的技術,Meta 展示的 AR 硬體已經相當接近了,比我預期的要近得多。我有機會親身體驗,那確實令人難以置信。使用者介面等細節都還需要完善,他們說:「沒錯,生成式 UI 顯然是解決方案,它會在任何時候都呈現出必要的內容」。我們現有的技術可以做到這點,但要將其產品化並使其實用,仍需要很長的時間。所以即使這就是「全部」了——我用引號是因為這已經很不可思議了——其影響依然相當深遠。
TL:是的,完全同意。
AI 監管
你寫過許多關於監管方面的文章,如果我理解正確的話,你剛才表達的不是懷疑論,而是「這很好,但不是你所闡述的一切」這樣的觀點,這似乎與你對監管的看法相呼應:一方面擔心監管太過嚴格,另一方面也對經濟上行的樂觀預期持懷疑態度。這樣的理解正確嗎?你提到過類似 Princeton School of AI Safety 的概念,我說得對嗎?
TL: 是的,我認為是這樣。我認為普林斯頓學派主要是在說,大家應該冷靜一點。這確實令人驚嘆,但創新本來就是一個循序漸進的過程,這不過是過程中的另一步。它與過去發生的事情的差異,其實沒有人們想像的那麼大。接下來還會有更多的進展,而不是「一旦達到 AGI,一切就會立即改變」這種說法。
我認為這對政策的啟示是,我們還有時間。雖然可能需要一些法規,但不會出現快速起飛並接管世界的情況,所以我們可以一步一步來。比如說:「好,我們現在有了 LLMs,這會帶來什麼問題?」舉例來說,我們有了關於色情換臉的法律,這是完全合理的管制對象。但那些只是看著模型就說「它安全不安全」的法律,似乎太過籠統、模糊,也太過野心勃勃了。
我認為我們處理新科技的一般方式是,先讓人們去使用它,觀察出現什麼問題,然後再制定法規來處理這些具體問題。但人們對此太過恐慌,想要跳過這個過程,直接說:「我們要立即制定大量法規,因為必須預防所有問題。」但依我看來,這並不是一個好方法。
你比較擔心的是監管不足且來得太晚,還是過於寬泛的監管來得太早且限制了可能性?
TL: 我想是後者。要記住的一點是,它可能有好處也有壞處。我從網路安全的角度來思考這個問題。有人說未來 AI 系統可以讓你入侵電腦,這確實會發生,但你需要的工具,就是那些用來檢查系統漏洞的工具,同時也正是用來防禦系統的技術。這是同一回事,而且防禦方通常擁有更多資源,也更有系統地處理這些問題,所以在許多情況下,我認為這些技術絕對是有益的。如果要求企業在發布技術之前必須證明不會發生任何壞事,我們就找不到好的東西了。所以是的,我認為這會造成傷害。
另外,我真的希望人們能專注在具體案例上。有很多監管制度,我們可以談談自動駕駛汽車,這只是其中之一,還有醫療監管,FDA 就有一整套監管制度來管理基於 AI 的醫療設備。監管方式可以有各種調整,但我認為,思考如何監管醫療設備或自動駕駛汽車等領域的 AI 會更有成效,而不是簡單地說:「這是一個模型,我們能說它安全與否嗎?」因為它是否安全取決於我們如何使用它、哪家公司在使用它、他們的商業模式是什麼、客戶是誰、有什麼安全保障措施等。
監管是否一定要針對 AI?就你所說的,如果只關注結果和影響,那麼這個法律也適用於一般的電腦演算法,其實並不是 AI 特有的問題?
TL: 是的,我認為如果你的法律需要定義 AI,如果你必須為 AI 制定與其他東西不同的規則,那可能就不是個好主意。
這確實是個很好的判斷標準。
TL:如果你制定規則禁止製作假的性愛影片,不論是否使用 AI,這應該是個好規則。就像 FDA 一樣,他們關心的是「安全且有效」,而不是是否使用 AI。某些情況下,比如要求自動駕駛車輛安裝後視鏡,這確實需要因應 AI 而調整。但是,如果規範對 AI 和非 AI 有不同標準,你應該認真思考:「是否過度特殊化?」以及「是否有更通用的規則可以套用在所有情況,不分是否為 AI?」
目前提出的 AI 法規中,有沒有哪些你認為「對,這才是正確的方向,很合理」的做法?或者大部分都是那種歇斯底里、過度誇張,既打不中要害又會扼殺創新的作法?
TL:我認為應該要按產業別來思考。舉例來說,我特別關注臉部辨識技術,因為這可能會衍生許多令人不安的應用,這方面確實需要更完善的監管制度。Google 主動選擇不開發臉部搜尋引擎,讓人無法拍下派對中某位女士的照片就能查到她的身份,這是好事,但最好還是有法律規範來確保這類功能不會開放給大眾。這就是一個例子,還有深偽色情內容也是。
我認為這比較像是在許多個別領域需要漸進式的調整。自動駕駛車輛也是,某些規範確實會有幫助,但還是要依產業來看。至於整體模型,我真的不認為需要任何規範。如果 Meta 發布下一代的 Llama 模型,我不認為需要特別的規範,因為本質上,模型就只是一個儲存權重的電腦檔案,不需要特別規範。
從整體來看,或許這反映了你的中西部背景,你似乎採取一種「小 C」保守派的立場。總結一下前面的討論:「人們過度誇大了好處,同時監管者又走得太遠」,風險與好處是密不可分的,如果我們誇大了好處,就表示也誇大了風險,因此過度防範風險反而會摧毀可能帶來的好處。
TL:對,差不多是這樣。
或許是因為我們的背景相似,在這點上我們的看法確實很接近。
AI 泡沫?
那你認為現在是泡沫嗎?
TL:這總是很難說。泡沫的難處在於,人們常常很早就開始喊泡沫,但泡沫卻持續擴大,而人們也持續喊泡沫。
沒錯,按照我的經驗法則,如果大家都說有泡沫,那就不是泡沫。
TL:是的,不過股票或房價總會在某個時點達到頂峰然後下跌,那些在最高點喊泡沫的人會說對,但那些一開始就喊泡沫的人可能是錯的。
我預期 AI 會經歷一個過度狂熱然後崩跌的時期。至於我們是否已經處於這個階段,或者正在邁向這個階段,這有點難說。我不認為會出現如網路泡沫那樣程度的擴張,因為如你所說,這項技術確實有明顯的效益,主要是大型科技公司在主導,而不是靠創投資金支撐。事實上,一些早期獲得瘋狂投資的公司已經被收購了。
嗯,我認為目前的熱潮確實有點過熱,可能會有些回落,但我不認為會出現大崩盤,也不覺得會在部署方面有太大的退縮。因為這項技術確實具有足夠的價值,會吸引許多人投入這個龐大的市場,而且很快就能產生許多有價值的成果。
這週我看到一個讓我很有共鳴的新理論,這對你來說可能是新鮮事,所以我想即時跟你分享。如果談到泡沫,回顧《Carlota Perez》模型中關於泡沫的重要性和驅動力,再看看網路泡沫時代,最關鍵的其實是電信基礎建設。當時有人認為,事後證明確實很瘋狂,所有人都在鋪設光纖,成本最終會降到零,而且因為這些大型基礎建設通常是靠債務融資,所以大家都會破產。但從長遠來看,這帶來了巨大的效益,基本上開啟了整個 Web 2.0 時代,讓所有人都能使用寬頻網路。經濟衰退確實很糟糕,但這些建設為社會帶來了巨大的效益。
回顧過去的電力或蒸汽時代,都有類似的循環,而重要的問題是:「如果 AI 泡沫確實存在,它能為社會帶來什麼好處?」晶片並不完全符合這個模式,因為晶片會損耗,而且會不斷進步。如果你買了一堆五年前的晶片,那有什麼價值呢?Doug O'Laughlin 發了一則推文讓我印象深刻。他說:「網路泡沫:電信 = AI:電力/數據中心」,我覺得這很有道理。如果你要建造更多核電廠,或是大規模投資太陽能和電池,或其他任何可能為這些技術提供動力的設施,這些投資確實可能讓你破產,因為你需要借很多錢,但這些設施的價值可以持續很多年。你覺得這個類比如何?我覺得很有說服力。
TL:是的,我完全同意這點。我本來就想說,最像泡沫的部分是 Microsoft 租用 Three Mile Island 20 年這件事。我們剛才討論過,「我認為規模法則會失去動力嗎?」我猜可能會,雖然我不確定是否即將發生。所以我不會驚訝,如果十年後人們回顧時說:「天啊,這些公司在數據中心和電力上花的錢有點浪費。」但就像你說的,國家確實需要更多電力,而且某個時候,我們可能會想要訓練非常大的模型,所以如果我們有很多巨大的數據中心可以用來訓練模型,這應該會產生一些價值。而且是科技公司在花錢,所以社會成本可能不會太高。我很喜歡這個類比,我以前沒聽過這樣的比喻。
是啊,我之前也沒有想到。這就是那種比喻,當別人提出來的時候,你就會覺得:「這真是再明顯不過了,我怎麼之前都沒想到。」我覺得這個觀點特別引人深思,因為人們總是對能源抱持著一種資源稀缺的心態,這或許可以追溯到 70 年代末的石油危機。但事實上,如果我們能有更充沛的能源,幾乎世界上所有事情都能變得更好。但要如何讓人們改變這種思維模式呢?這幾乎是不可能的,你必須先讓能源變得更充足,讓人們親眼看到成果。所以如果我們真的能推動核能建設,這在六個月前或兩年前看來都是不可能的事,即使這對 AI 的發展沒有幫助,但對社會的正面影響依然可能是天文數字般的巨大。
TL:對,完全同意。
這跟光纖的情況非常類似——這是個好題目,我會把這則推文傳給你,你可以繼續發展這個想法。
自動駕駛汽車
好,我們來談談自動駕駛汽車。這就是我們一開始想邀請你來討論的話題。我一直在思考這個問題,你也寫了很多相關文章,採訪了業界人士,也拜訪了一些相關公司。這讓我想到你說的那個比喻:一年高估,十年低估。現在 AI 最火熱,就像五、十年前自動駕駛汽車最受矚目一樣。
TL:是的。
而大家都忽略了一個事實,「不,我們其實已經站在突破的邊緣了」。這是你的看法嗎?
TL:是的。我已經報導自動駕駛汽車十年左右了,所以我經歷過 2017、2018 年時人們對它充滿熱情的時期。這段經歷實際上很影響我對現在生成式 AI 技術的看法,因為感覺完全一樣。當時有很多人——在 2017 年,你有 Ford 和 Lyft——
那些展示真的很令人驚艷。
TL:展示確實很驚人。當時有人說到了 2021 年,我記得 Ford 說:「我們要在 2021 年推出一款沒有方向盤的汽車」——Lyft 好像說到了 2020 年代初期,他們一半的車輛都會是完全無人駕駛的。那時我年輕也比較天真,覺得這至少是可能的,甚至很可能發生。現在看到它沒有那麼快發展,我有點驚訝,但現在環顧四周感覺又是一樣的情況。然後就是經典的 Gartner 技術成熟度曲線,第一波炒作高峰是在 2018 年 3 月,當時 Uber 在亞利桑那州發生了撞到行人的事故。接著我們經歷了三、四年的——
失望的低谷期。
TL:對,低谷期。
說實在的,這是 Gartner 有史以來最棒的產出,那張圖表太精準了。
TL:現在我們正處於最後階段,熱潮減退了許多,人們對此也更務實了,但 Waymo 在加州每週提供 15 萬次載客服務。我還不太確定他們的單位經濟效益如何,他們對於遠端協助的程度一直守口如瓶,這是個重要問題。
對。
TL:我確實不認為他們已經完全脫離困境,但每週 15 萬次載客量已經相當可觀,顯然如果他們對技術沒有充分的信心,就不會擴大營運規模,而且我們確實在累積大量實戰經驗。現在已經不用懷疑這項技術在未來五到十年內會變得可行。事實上,熱潮正在重新升溫,我認為正逐漸達到適當的期待值。但相較於生成式 AI,它的關注度可以說是低得多。
我想說你是看好 Waymo 的,這樣說對嗎?
TL: 對。
你觀察到什麼?為什麼你認為他們會成為贏家?他們有什麼優勢?
TL: 主要是因為他們每週執行 15 萬趟無人駕駛載客服務。基本上,其他公司幾乎沒有在做無人駕駛載客,這是最關鍵的。一年前,我會說 Waymo 和 Cruise 是領先的公司。但在去年十月發生那起事故之前,我認為他們的技術不如 Waymo,而且我也擔心可能會發生類似的事故。當時他們是前兩大公司。後來 Cruise 因為那次事故被迫暫停了好幾個月的無人駕駛計畫,現在 Waymo 就遠遠領先其他競爭對手了。他們最早起步,一直都擁有最頂尖的技術團隊。你提到默會知識,我認為很大一部分就是需要處理許多繁瑣的細節。你必須經歷大量學習過程,處理很多基礎建設問題,而 Waymo 在這十到十五年來持續投入大量資金,現在終於開始有了回報。
我在 2018 年時有個想法,當時覺得 Waymo 的部署速度不如預期,而且有很多新創公司嘗試做較小範圍的商業模式。例如有間叫 Voyage 的公司,打算在佛羅里達州的一個退休社區提供叫車服務,那裡最高速限是每小時 25 英里,而且是私人社區,因此比較少法規問題。還有一間叫 Nuro 的公司做機器人送貨服務。我原本以為這些小型公司會率先成功,然後就會出現典型的破壞式創新故事:從最小可行產品開始,逐步擴大規模,我以為這個策略會很成功。
Voyage 後來資金用盡,被 Cruise 收購了。Nuro 還在,但已經轉向不同的商業模式。這些我看好的新創公司都沒能成功,最後成功的反而是那間擁有大量資金的公司。他們一步一步踏實地做,我認為原因在於其實並沒有比較容易的方案,因為即使你選擇有限的營運範圍,還是可能會遇到小孩突然衝到車前,或是輪椅追著鴨子跑等狀況。就算你選擇較簡單的數據集,實際上也不會容易到哪裡去。你真正需要的是看到所有極端案例,並且開發出能應對的軟體。所以最後贏的是那個願意深入投入的公司,到目前為止,這家公司似乎就是 Waymo。
對於 Waymo 很早就開始這件事,你怎麼看?我寫過相關文章,在這裡是否存在苦澀教訓的類比?他們是否太過執著於解決每個極端案例、弄清楚每種情況?雖然這確實表現得更好,這也是為什麼他們遠遠領先其他方案。我幾個月前搭過一次,確實令人印象深刻,比我試過的其他方案都要好上許多。但是否最終會有一個極限?因為它永遠無法完全通用化且獨立思考。這是你擔心的問題嗎?還是你認為他們最終還是更有可能解決這個問題?
TL: 我的意思是,雖然很多人這麼說,但因為我們對這些公司的內部運作缺乏深入了解,所以這種說法很難成立。你的說法有點像是對 Tesla 的批評,我們等一下再詳談。但這種說 Waymo 被困在十年前設計的硬編碼規則和龐大程式碼庫的說法是錯誤的。
沒錯。
TL: 所以說他們因為這些遺留程式碼而無法進步的說法並不正確。事實上,他們一直在發表研究成果,在這些自駕車公司中,我認為他們是最透明的,至少他們會發表研究成果,而且這幾年來一直在進行神經網路和生成式 AI 網路的實驗。
對我來說,這反而證明了他們的方法是有效的,因為這表明真正需要的是海量資料和資料中心。這就是為什麼他們不擔心洩露機密,因為真正重要的部分是別人無法複製的。
TL: 是的,我認為這是對的,擁有資料很重要,但還有許多隱性知識。去年我一直在思考的其中一件事就是與緊急應變人員的互動,因為只要還有安全駕駛員在場,如果你遇到車禍現場或是消防員在滅火的場景,安全駕駛員就會接管並採取適當行動。
要讓軟體真正能夠自行處理這種情況,車內就不能有任何人,因為這樣就別無選擇,必須自己來處理。通常他們需要遠端協助,在這類情況下,沒有什麼比實際操作、失敗,然後找出新的解決方法更重要。也許有一個通用的 AI 解決方案,但有時最好的解決方案是——比如說,他們建立了讓警察可以直接進入車內自行駕駛的功能。
所以有很多不同的解決方案。有些確實需要更具通用性的解決方案,而我沒有看到任何證據顯示 Waymo 在這方面比 Tesla 差。但有些則是——他們在舊金山還有一個系統,舊金山的 911 系統可以發出「這個區域有緊急情況」的通知,所有的 Waymo 就會避開該區域,選擇其他路線繞行。
對。
TL: 像這樣的功能有很多可以開發。這不是什麼高科技 AI,但如果城市感覺你在傾聽他們的需求,你就能與他們建立更好的互動關係,而且必須因地制宜。Tesla 認為只要按一個按鈕就能在全國實現無人駕駛,警察部門和州議會就會聳聳肩說:「好吧,我們沒辦法要求 Tesla 遵守規則」,我不認為事情會這樣發展。我想他們在嘗試之前就會意識到這行不通。
你覺得加州對自動駕駛汽車的監管方式是好的嗎?
TL: 我認為還不錯,他們算是比較嚴格的,我覺得他們找到了很好的平衡點。有幾個州,比如紐約就是一個很好的例子,我認為太過嚴格,不過這有點難說,因為下雪仍然是比較棘手的問題之一。
沒錯,自動駕駛汽車不在北方出現是有原因的,這與法規無關。
TL: 是啊。即便紐約有完善的法規,他們可能也不會有任何進展。沒錯,他們的規定太過嚴苛了,我認為設下太多障礙。至於加州,據我了解 Newsom 州長對這類事物相當友善。他否決了一項立法院通過的法案,該法案實際上是要禁止超過一萬磅的無人駕駛卡車。我所知道的是,Newsom 州長任命的監管者對無人駕駛汽車都抱持友善態度。
就我這個經常認為加州在這類事務上容易走錯方向的人來說,他們在這方面已經給予了發展空間,我認為這是相當正面的。
TL: 是的,他們遭受到很大的阻力,尤其是在舊金山,市政官員非常不喜歡 Waymo,基本上試圖關閉它,但州立法機關和州長將這些政策決定保留在州政府層級,基本上無視舊金山當地人的意見,允許 Waymo 繼續營運。
但我要說的是,在這個光譜上——他們處於較嚴格監管的一端,然後像德州這樣幾乎完全沒有監管,你想做什麼都可以。到目前為止,這種做法也行得通。我是說,只有在亞利桑那州發生過一次致命車禍,那裡也是一個管制相當寬鬆的州,涉及的是Level 4 自動駕駛車輛。但我認為,在多家公司進行十年測試的過程中只有一次死亡事故,這個紀錄相當不錯。
沒錯,特別是跟人類駕駛相比。
TL: 是的,確實如此。不過,這其實很複雜,因為人類平均每一億英里才會發生一次車禍,如果把所有這些自動駕駛車輛的里程加起來,大概也差不多是這個數字,所以總體來說實際上是差不多的。但無論如何,考慮到這項技術可能帶來的效益,我認為業界一直都相當謹慎,而 Uber 在那次事故後基本上承擔了企業責任,實際上關閉了他們的自動駕駛計畫。我認為德州的做法也不錯,但最佳方案可能在德州和加州的做法之間。
說到德州的監管,我最喜歡的事實是:哪個州擁有最多的太陽能板和電池?不是加州,而是德州。我曾在 Sharp Tech 節目中談到過這個話題,這類事情確實是聯邦制度最有力的支持論據之一。不同州可以採取不同的做法,而且光是談到天氣因素,亞利桑那州、德州和加州確實比紐約或威斯康辛州更適合推動這項技術。從全方位經濟的角度來看,長遠來說,如果不只是天氣較好,而是搬到溫暖的地方就能使用自動駕駛汽車,這對中西部來說絕對是一個重大打擊。
TL: 我認為這不會是永久性的。我想他們只是在一步一步來,而且有很多陽光充足的南方地區可以實施。我認為大概需要兩到三年的時間,這不會成為長期的劣勢。但是沒錯,在這個十年或下個十年初期,這確實會成為德州的一個優勢。
讓我們稍微總結一下,你認為加州或德州在監管方面做對了什麼,這些經驗對 AI 監管有什麼啟示?是否有某些原則促成了這些創新,還是這兩者之間其實沒有太大關聯?
TL: 我認為這些州都採取相當寬鬆的態度。德州讓你想做什麼就做什麼,加州則要求你申請許可並說明「這是我的營運地點和其他資訊」,但基本上只要你提出申請他們就會同意,很少會拒絕。某些產業,比如 FAA,你基本上必須向他們證明你的飛機是安全的才能飛行,需要進行大量測試,雖然我不清楚細節,但你必須先取得 FAA 的執照才能讓飛機起飛。加州和德州都沒有這麼嚴格的規定。他們只要求特定的資料和資訊,有一些最基本的要求,像是確保你有適當的保險等,之後基本上就讓你自由發展。他們的做法比較像是等到出現問題時才會介入並要求你停止。
是的,相較於可能的管制方式,他們都採取相當寬鬆的態度。老實說,加州的 AI 法規 SB-1047 在幾個月前被否決,我雖然不太支持這項法案,但它其實算是相當溫和的,並沒有設立執照制度。我認為提出這項法案的 Wiener 參議員已經盡量讓它不具侵入性,到了一個程度,這項法案可能不會帶來太大改變。如果你擔心安全問題,它設定了很高的適用門檻,也沒有太多要求。整體而言,這些管制制度都還不錯,你可以想像更具侵入性的法規會造成更大的傷害。
在 Waymo 成功的情況下,你剛才提到單位成本,那只是針對邊際車程,因為這會影響到可以接手或觀察的人。但還有這些車輛的固定成本,其中一個挑戰是,這些在街上行駛的車輛可能會發生事故,人們會用力關車門,這些不會是長期資產。這不是軟體,而是會磨損的硬體。你認為這種模式擴大規模時會如何發展?還有尖峰時段的問題,有時候需要大量車輛,有時候又完全不需要。如果 Waymo 的模式是正確的,你覺得這會如何發展?
TL: 這個問題上,我認為短期和長期的區別很重要。目前據傳 Waymo 的車輛成本大約在 15 萬美元左右。它們是以售價約 7 萬美元的 Jaguar I-PACE 為基礎,然後因為這些 Waymo 的感測器和技術並非在工廠直接安裝,所以還需要進行改裝,具體金額我們不清楚,但假設是 5 萬美元,基本上就是把車子拆開,裝上感測器和電腦,再把車子組裝回去。然後那些實際的感測器——
對,某種程度上你是在組裝兩次車子。
TL: 沒錯,所以這某種程度上讓成本翻倍。再加上感測器,雖然我認為大家對 Lidar 的重視程度過高,但 Lidar 可能要花費 1 萬到 2 萬美元左右。這樣的成本已經高到難以維持一個獲利的服務。但是車輛製造並不是新技術,你真正需要做的就是說服一家汽車製造商設立專門的生產線,在組裝過程中就把感測器裝進車子裡。
目前 Waymo 可能需要提出數萬台的訂單才能達到規模效益,這就產生了一個雞生蛋、蛋生雞的問題。現在,即使他們有一萬台車從生產線下來,他們仍缺乏其他必要條件,像是法規許可、維修人員、充電人員等等,就連十個城市都無法完全配置。因此這就形成了一個循環難題:他們需要更多車輛、更多城市、更好的軟體,以及其他所有配套。但他們終究會達到目標,十年後當他們擴展到百個城市,每年採購十萬台車輛時,要找到願意用專屬生產線、成本相近的製造商應該就不會太困難了。
雷達系統也是相同的道理。經濟學中最可預測的法則之一就是消費性電子產品會隨著規模擴大而降低成本,所以如果他們能下十萬台雷達的訂單,價格會比現在下一千台訂單便宜許多。所以我不認為這是個大問題。我想在五到十年內,這些車輛的價格會比一般車貴個十萬到二十萬台幣,而不是現在的三百萬台幣。到那時,經濟效益就會變得相當可觀。你看,我住在城市裡,往窗外看就能看到很多車停在街上。即使是大家都在工作的白天,停車的數量依然很多。所以從經濟角度來看,讓車子閒置其實並不會太昂貴。
但這是否又是一個科技人的思維?「只要每個人改變習慣,一切就會變得很好」,實際上這可能需要世代交替,還是說 Uber 已經造就了這樣的改變?
TL: 我的意思恰恰相反,就算人們不改變習慣,使用率不那麼高,你也不需要很高的使用率就能讓價格具有吸引力,因為計程車費用中約有一半是支付給司機的薪資。所以如果不需要司機,在其他條件不變的情況下,車資應該可以減半。我認為透過車隊管理和電動化,長期來看這些車輛可能會更小型,因為事故風險較低。
總之,還有很多方式可以降低成本,但即使什麼都不改變,只是去掉司機這個因素,長期的均衡價格應該會是現在的一半左右,這會使計程車變得更具吸引力。雖然不是每個人都會放棄擁有私家車,但會有更多人決定從兩台車改成一台車,或是從一台車改成零台車,這樣市場規模就會比現在大得多。看看 Lyft 和 Uber,十年前他們透過大量補貼搶佔了相當大的市佔率,後來他們說:「糟糕,我們需要獲利」,於是提高價格,市場就稍微萎縮了。但有了無人駕駛車,這個商業模式就真的可行了。
整體而言,現在搭乘計程車(包括 Lyft 和 Uber 等)的人數比這些公司出現之前高出許多,可以說是成長了好幾倍。以前麥迪遜市只有五輛計程車停在機場,僅此而已。現在到處都有 Uber,人們經常使用,這種需求創造的面向常常被人低估。
TL: 沒錯,我認為這個趨勢會持續發展,如果價格真的比傳統計程車便宜一半,規模會更大。此外,我認為長期來看安全性會更高。也會有一定數量的人更傾向於不必與司機進行閒聊,這也是一個考量因素。
不過有趣的是,究竟哪一個才是真正跨越魯比孔河的時刻?是自動駕駛汽車的出現,還是我們早在 Uber 和 Lyft 出現時就已經跨越了?說起來我都忘了,我想我在好幾年前就寫過,大意是說:「看吧,我們其實已經有自動駕駛汽車了,就是 Uber 和 Lyft」,只是電腦恰好是人類而已,但實際的影響,我們現在都看得到了。
TL:這種說法雖然有可能,但我不認為是對的,我覺得這會是第一步。在接下來的五到十年內,我認為這個模式是正確的,Waymo 和其他公司會取代 Uber 和 Lyft,或者 Uber 和 Lyft 會成為他們的合作夥伴。總之,我們會從人工駕駛的 Uber 轉向—
這樣人類就能處理需求高峰期,並負責這些車輛的維護和清潔等工作。
TL:這是第一階段,但我認為一旦 Waymo 進入了一百個城市,完成了大部分地區的地圖繪製,他們就能去找汽車製造商說:「你們可以將 Waymo 技術整合到你們的車輛中,作為一項增值服務,這樣顧客就能購買具備 Waymo 服務的車輛」。到那時,每個人都能買到自動駕駛汽車。我對於具體比例沒有特別的看法,我想會有較少人想要擁有私家車,但肯定還是會有人想要。有些人需要放置他們的汽車座椅或高爾夫球具,所以這種情況會存在。我認為第二階段就是自動駕駛會成為一個可選配的功能,但這會比較困難。
我認為必須先從計程車服務開始,因為這需要大量的基礎設施支援。你需要有基本的維修能力,如果你擁有一輛車,感測器壞了卻不願意送修,製造商不會想承擔「如果不修理可能會發生事故」的責任風險。總之,我認為這會是第二階段。此外,我也認為一旦這成為一個成熟的產業,就會開啟許多新的車型設計機會。就像我之前提到的,我認為可以製造更小型的車輛。因為現在當你買車時,你會買一輛能滿足所有需求的車,所以如果你有一個五口之家—
就像買房子時為了偶爾來訪的客人準備客房一樣。
TL:對,就是這樣。你需要一輛能長途旅行的車,需要能容納所有孩子的車,諸如此類。但如果有更多計程車服務,某些市內短程行程可能只需要一輛雙人座的小車。人們就不會想買那麼大的車了,因為你可以輕易租用一輛長程車或休旅車。
我理解對 Tesla Robotaxi 發表會的許多批評,但我不理解為什麼有人批評它只能坐兩個人。想想看,雖然我沒有確切數據,但我敢打賭 Uber 載客量絕對有超過 90% 是單人搭乘。對我來說,有很多可以挑剔的地方,但顯然主流車型就會是雙人座。也許不會是傳統的車型,而是像 Zoox 那樣的概念,類似小型模組化巴士。但就像你說的,我們可以在這方面做更多專門化設計。
TL:接著我認為會出現新型態的車輛設計。業界長期以來一直在討論的其中一項是睡眠車,就是晚上車子來接你,你躺在床上,它開八小時的車程把你送到緬因州的度假小屋之類的地方,然後你早上醒來就到了。很明顯,這種設計現在還無法實現,因為需要有人駕駛,還有其他問題。可能還會有其他形式的設計,比如車子看起來就像你的辦公室,你可以在兩小時的通勤路程中工作,這些都是可能的發展方向。所以從長遠來看,一旦技術成熟,就會有許多不同的發展可能,接著才會產生社會經濟效應。但是,在開始探索這些之前,我們必須先讓技術成熟並廣泛應用。
你認為在過渡期會遇到挑戰嗎?如果今天所有的車子都是自動駕駛,我們可以更快達到目標,但問題是路上還有很多一般的車輛,而且有既有模式的路徑依賴。解決方案是要循序漸進地在現有框架下前進,還是需要一個戲劇性的改變來推動這個大轉變?不是說我們需要一個汽車界的 COVID,但可能需要某種程度的重大轉變。
TL:我認為從成本和安全性來看,這會是相當具有說服力的改變,所以漸進式的方式應該會很有效。我覺得很可能會發生的一件事是:現在如果有人酒駕被抓到,要判定「你不能再開車」是一個很重的懲罰。在目前的情況下,這可能意味著你無法去上班,無法在社會中正常生活。一旦自動駕駛車普及,或者你可以買到自動駕駛車,我想我們會更願意說:「如果我們抓到你危險駕駛或酒駕之類的行為,我們會取消你的駕駛權,因為你仍然有辦法四處移動」,這樣就能看到相當大的安全效益。
這很有趣。
TL:不僅是自動駕駛車本身更安全,我們還可以更快地讓危險駕駛人離開道路,所以我們可能會達到這樣的情況:即使只有一半的車輛是自動駕駛,但已經能獲得 80% 或 90% 的安全效益。實際上你已經可以看到,只有很小比例的駕駛人造成了大多數的事故,所以我認為隨著自動駕駛車的增加,不僅這些車本身的事故會減少,對其他人來說也會更安全,因為你有望讓一些危險駕駛人離開道路。
這是個好觀點。我們應該要有個方案,就是「如果你要吊銷某人的駕照,就給他們 Uber 點數,因為我們需要在這方面更嚴格」,這個概念大概適用於很多事情。
Google 與中國汽車製造商有合作,關於關稅問題是否令人擔憂?推動中國汽車製造業蓬勃發展的因素有很多,特別是在電動車方面,它採用了更接近 OEM 的模式,有一個通用平台可以在上面進行開發,這似乎非常合適。如果你想要一個擁有大量針對不同使用情境客製化車輛的世界,這就是應該採用的方式。但同時我們與中國之間存在緊張關係和貿易問題。無論如何,汽車產業肯定會是一個重要焦點,這是否會顯著阻礙這個發展?因為我們不只是在保護美國汽車製造商,也在保護現今的汽車製造方式。
TL:有這個可能。這是 Waymo 特別面臨的問題,因為他們簽了一份合約。他們目前的車款是 Jaguar I-PACE,幾年前他們與 Zeekr 簽約(我想是由吉利汽車所有的中國公司)製造他們的下一代車輛。之後拜登政府對所有中國汽車課徵了 100% 的關稅,情況不是很明朗。我聽說 Zeekr 可能會在南韓或墨西哥生產,但最近 Waymo 又宣布與現代汽車達成合作協議。所以我不會驚訝他們會跳過這些數字,只買幾輛 Zeekr,然後盡快推出現代汽車。
是的,我認為中國確實有可能主導電動車產業,這些創新也可能會比在美國更早出現在美國以外的地方,這取決於美國以外的公司是否能獲得自動駕駛技術。我對中國的自動駕駛技術發展沒有很清楚的了解,確實有許多公司在研發自動駕駛技術。我聽到一些相互矛盾的報導,有說他們與美國水平相當,有說略勝一籌,也有說略遜一籌。由於我不懂中文且沒去過中國,我不會試圖評判,但美國和中國確實都在這個領域發展。
這是一個普遍的重要問題,到底是軟體還是硬體更重要?你寫過幾篇關於戰爭方式的變化和無人機等相關文章。在戰爭中什麼才是真正重要的?在汽車領域又是什麼最重要?這是類似的問題。是軟體會勝出,還是硬體會勝出?
TL:我認為,就實現自動駕駛而言,軟體是關鍵。我認為光達技術目前已經相當成熟,擁有更好的光達並不會帶來巨大優勢,所以從技術實現的角度來看,關鍵在於軟體。但問題在於成本。可能 Waymo 擁有出色的技術,但成本是中國版本的兩倍,因此在保護主義的影響下,Waymo 可能會主導美國市場,但世界其他地方可能會採用大量中國技術。我認為如果我是這些公司之一,我最擔心的是「我能否快速且低成本地擴張,使其在全球具有競爭力?」
這看起來確實可能是一個創業機會。你在套利美國汽車製造商的身份所帶來的一切,以及我認為這些關稅短期內不會取消的事實,來建立一個超級模組化的通用平台,可以在上面放置各種不同的東西,為 Waymo 量身打造,這是一個很好的賭注。
顯然特斯拉走的是另一條路。你對特斯拉的做法有點懷疑或相當懷疑。我們已經超時了,所以在最後談這個可能不太公平。你對此有什麼看法?
TL:老實說,我希望特斯拉能更專注於製造電動車,因為我的印象是,就製造平價車而言,他們正在落後於比亞迪等公司。之前有很多關於將推出 25,000 美元車款的討論,這似乎是特斯拉為了與國際競爭必須製造的產品,但現在似乎演變成了我更擔心的 Cybercab。就我的整體看法而言,我只是沒看到任何證據表明特斯拉有能力縮小與 Waymo 的差距。就他們的能力而言,他們一直落後 Waymo 三到五年。如果你看看 2018 年,Waymo 已經接近準備好無人駕駛,而特斯拉只有一個基本的駕駛輔助系統,在市區行駛方面功能很有限。
主動式定速巡航,是的。
TL: 沒錯,主動式定速巡航。現在五、六年過去了,Waymo 已經在相當大的規模上實現了完全無人駕駛服務,而 Tesla 大概處於 Waymo 2019、2020 年的水準,就在無人駕駛的門檻上,但僅僅是個開始。Tesla 的支持者認為 Tesla 會很快趕上這個差距,但我實在看不出有任何理由支持這種想法。
我認為人們過分強調 Waymo 在地理位置上的限制,他們以為這是因為 Waymo 的技術範圍較窄,但我認為這更多是與我們之前討論的後勤因素有關。由於他們經營計程車服務,需要建立車輛中心、僱用人員清潔和充電車輛,在某種程度上需要收集地圖並在每個地點進行一定程度的訓練,但我認為這其實不是主要問題。我不認為 Tesla 能夠跳過這些人員配置、不動產和法規問題。
我認為這種情況已經開始顯現。Tesla 並沒有說「2025 年我們要在所有地方啟用無人駕駛」,而是說「我們要在加州和德州實現無監督的全自動駕駛」,這表明他們意識到地理位置的重要性。這可能部分是法規問題,但德州的管制很寬鬆,亞利桑那州也是,如果純粹是法規問題,你會預期他們會宣布在一堆共和黨州實施。我認為他們已經意識到無人駕駛需要一定的基礎設施,所以他們基本上走的是與 Waymo 相同的路線。我認為他們做得不錯,最終會達到目標,但就是比 Waymo 落後三到四年。
你也寫過這個問題,這一點讓我很驚訝,就是現在的 Tesla 在確保駕駛人保持注意力方面非常嚴格,除非你親身體驗過,否則從外部很難得到這種印象。但正如你所說,這可能是從經驗中學到的教訓。
TL: 這確實改變很多。以前你可以在方向盤上掛個重物,因為它只有扭力感應器,就能讓你免手駕駛一小時,但他們因此受到教訓。有好幾個人喪生,所以現在他們安裝了前向攝影機,而且管制非常嚴格,我認為這是很好的改進。但他們仍然有很多工作要做。
好吧,這是一場廣泛而深入的訪談,我們其實可以更深入討論。Tim,我很喜歡這次對話的地方,這可能是我中西部人的特質在作祟。你對很多事情都採取非常務實的觀點。就像是「讓我們看看目前實際存在的東西,看看它在多大程度上有意義,讓我們用這種方式來規範」,我真的能從你的觀點和處理方式中感受到這種一致性。我很享受閱讀你的文章,也很高興在這次討論中看到這一點。
TL: 謝謝,我真的很感激。我想這是因為長期報導這個產業——
沒錯,年輕時會相信那些炒作,但現在年紀大了,就會說「能給我一些證據嗎?」。
TL: 是的,我覺得我知道該從哪裡找答案。比如「這是一個令人印象深刻的展示」,但如何去看一家公司的產品,試用它們,與客戶交談,與供應商交談等等?希望能得到一個全方位的視角,就像「這就是展示的內容,但這裡還有所有其他必須發生的事情」。所以是的,我對長期發展持樂觀態度,但我認為很多人低估了在真正讓這些技術運作之前,需要累積多少隱性知識。
好的。他的網站是 understandingai.org。Tim,很高興能和你談話,希望以後還有機會再聊。
TL:謝謝,聊得很開心。
本期《每日更新訪談》也提供播客版本。若要在您的播客播放器上收聽,請造訪 Stratechery。
《每日更新》僅供單一訂閱者使用,但偶爾轉寄是完全可以的!如果您想為團隊訂購多份訂閱(至少 5 份)並享有團體優惠,請直接與我聯繫。
感謝您的支持,祝您有美好的一天!