【獨家】台灣人工智慧實驗室創辦人杜奕瑾:讓我們集結台灣不遜全球的人才與實力,在AI革命中取得先機,共同解決世紀的難題

【獨家】台灣人工智慧實驗室創辦人杜奕瑾:讓我們集結台灣不遜全球的人才與實力,在AI革命中取得先機,共同解決世紀的難題

中文翻譯:黃維德


編輯導言:這一篇一萬兩千字的內容,來自「台灣人工智慧實驗室」創辦人杜奕瑾,於 2017 年台北 Computex 中,應邀出席輝達(NVIDIA)論壇,擔任主講人的演講內容。

《換日線》獲得杜奕瑾先生授權,將演講內容與問答完整翻譯為中文,希望能夠讓更多對未來科技趨勢,包含目前席捲全球的人工智慧、AI應用,以及基因研究(利用 AI 的深度學習理論嘗試其醫療應用,解決罕見疾病問題)有興趣的中文讀者,進一步了解目前「台灣人工智慧實驗室」的努力方向,以及台灣和相關人才在全球科技革命中,有機會扮演的重要角色。

以下為演講內容獨家完整中譯:

NVIDIA 人工智慧論壇(下午場)

【下午場-NVIDIA 人工智慧論壇,即將登場!】 看完了執行長黃仁勳的精彩演說後,接著我們即將為您播放的是一連串的人工智慧議題演說,講者包含NVIDIA 的專家 Deepu Talla 與 Marc Hamilton 以及人稱 PTT 創世神的杜奕瑾!13:30 臉書準時開播,錯過可惜啊!#Computex2017

NVIDIA Taiwan 貼上了 2017年5月29日


(杜奕瑾的演講部分由 48:00 開始)

謝謝主持人介紹,我很榮幸能成為這場 Nvidia 的論壇中,唯一的客座講者。

午安,台灣!

今天我想分享的故事,不是我個人的故事,而是與台灣的人有關:我們該如何組織起來,一同創造最熱門的技術。

在台灣,我們有所謂的「鄉民文化」。在這裡我的解讀是:每當出現我們想處理的熱門問題,「網路鄉民」的我們,會試圖組織各式各樣的專業能力,一同解決問題。「鄉民文化」來自台灣最大的 BBS 站 PTT,但它不是一間公司,PTT 是我們在 22 年前就創立的非營利組織。有人會說我是 PTT 的創立者、我成就了非常多東西。但如果你仔細想想,其實我並沒有成就很多事物,成就 PTT 的,是你們所有人。

你們利用你們的創新能力、想法和創意,試圖透過網路的力量,共同解決世界上、社會或文化之中的種種複雜問題。

因此,在這個想法的激勵之下,想看看世界怎麼一同解決困難的問題,我踏上了離開台灣的職涯和學習之旅:在 2003 年後,我加入了美國國家衛生研究院(National Institutes of Health, NIH),在人類基因組研究院工作。當時,那是人類史上首次,我們定義了人類基因組。雖然我們知道如何定序,但我們完全不了解它。

一開始,我們先研究基因與癌症的關係:我們花了超過 10 年、NIH 花了超過 50 億美元,才為一組人類基因組完成定序,那時我們不知道它能做什麼,但我們知道這其中一定藏有秘密。

現在,基因定序的相關研究已經有了一些成果,我稍後也會告訴各位,我們怎麼處理人類基因組的應用。

踏上 AI 研發之路:從美國國家衛生研究院,到微軟研究院的網路實驗室

接著我加入微軟(Microsoft)。

微軟是間非常棒的公司,也給了我很多自由,讓我得以思考,我們該如何用不同的方式做事。很幸運地,我進了 MSR(微軟研究院)中最有趣的實驗室之一:由沈向洋(Harry Shum)成立的 ISRC(網際網路服務研究中心)。那時,我們的目標是嘗試分析世上能找到的所有資料,去理解搜尋引擎的邏輯,以及嘗試改善、優化搜尋引擎。

接著我加入了搜尋引擎 Bing,在 Bing,我們會做 Dynamic Crawler──也就是如何有效率地、動態地取得資訊。那不像是靜態的 HTTP 頁面,而是瀏覽器產生的結果,我們試圖理解它,再依照我們的理解,製作索引。

接著,在大約 2013 年左右,微軟的人工智能助理 Cortana 這個計畫,讓我的研究方向與方法出現了非常大的轉變:

Cortana 一開始只是個小計畫:它是除了 Windows、Bing 這類主要計畫之外,有點像是微軟內部的新創小專案。

我們一開始是個小團隊,我們投入自己對革新的想法,並在 Windows 上推出了第一版的 Cortana。第二年,我們團隊也首次在其所有主流 OS 系統上推出了 Cortana:我們想讓世上每一個人,都能夠擁有一個了解自己的個人助理。

開發 Bing 這個搜尋引擎,我們想了解的是全世界;開發 Cortana 個人助理,則需要深入了解一個人。如果有一個個人助理可以了解一個人,又能連結世界上的知識,也就代表我們能為這個人提供非常好的服務。

老實說,製作個人助理非常困難,需要各式各樣的專才,包括語音、語言學、人類學等,也會碰上各式各樣的問題。

幸好,微軟蒐集了非常大量的資料,也擁有非常優秀的研究中心,不斷地嘗試改善語音辨識、語言理解、使用者體驗等領域,讓我們能快速地推出 Cortana 這個服務。

與人工智能 BOT 對話,幫助人類與機器一同工作,是未來的大趨勢

2016 年,我們在微軟 Build 上宣佈:將 Cortana 定位為整個人工智慧和情報資訊的中心。當時我們提出了三個想法:

1. 對話會是下一代的使用者介面:意思就是,未來我們與機器溝通之時,會使用人與人之間的對話形式──若人類與機器一同工作,那是最自然的方式。

2. Bots 會是下一代的應用程式:稍後我會談談 Bots,今天我們用觸控螢幕、鍵盤來與機器合作,那不是我們應該使用的方式。未來,你會和機器對話,因此,每一項專業都會變成 bots。

3. 所有的用戶體驗都會注入人工智慧:如果沒有 AI,bot 不過只會是又一個只會制式反應的「笨蛋 bot」──你只是把使用者介面從按鍵或觸控換成對話,這完全行不通。因此,我們得做的第三件事,就是確保每一個 bot 都擁有聰明的人工智慧,你得協助使用者、了解使用者,才能成就、完成更多事情。

全世界的科技巨頭,都在做同一件事:改變我們與機器溝通的方式

這件事本身也不是個簡單的問題。

去年我們在 Build 上宣佈了 bots 策略之後,Facebook 宣佈了它們的 Messenger Bot;Google 也推出了跨平台的助理 Allo。

你可以發現,所有的科技龍頭都在做同一件事情:那就是運用人工智慧改變我們與機器溝通的方式,也有長足的進展。

也因此,下一個問題就是:這些大公司全都已經在做人工智慧,我們能做什麼?

這是我在產業的觀察:我們推出 Cortana 的時候,由於 Cortana 擁有非常多能力、大家也想要,所以我們也推出了 Cortana Intelligence Suites 與 Microsoft Cognitive Service 讓大家都可以使用 Cortana 的部分功能,同時我們也推出 Microsoft Bot Framework 讓大家可以建立自己的 bot。

但我們也發現了問題:我們在深圳宣佈 Cortana Intelligence Suites 與 Microsoft Cognitive Service 等各項服務的時候,產業領袖會問我們:如果我買了 Cortana Suites,是不是只要連上了,我的 bots 就突然能開始說話了、開始變得很有智慧呢?並不是這樣的。

科技龍頭如微軟和前述的巨擘們,目前所推出的平台,在 AI 的應用基礎上非常重要,讓你不必重做語音辨識、人臉辨識等等事情。然而,針對特定領域,例如,如果你是個家電製造商,想讓家電能說話,運作起來像專業領域一樣聰明,單只是買下 Microsoft Connected Service 和 Cortana Suites,或任何其他網路巨頭的 AI 平台都是辦不到的:你還是需要對它進行很多調適,給它很多專門的經驗。

也就是說,雖然今日 AI 已經可以在圍棋上擊敗人類,但這是在「特定領域」特別訓練出來的,AI 不會自己習得所有領域的學問。以應用來說,要從 Microsoft 與 Google 等提供的服務,直接開發對特定領域的完整體驗,仍舊需要有專門領域的人投入做「訓練」,而所有做的事情越是開放,越會成為之後的標準。

從全球科技巨頭的產業缺口中,思考台灣的機會

這促使我開始思考:我們能不能在這裡(台灣)做點什麼,一如我們 20 年前在 PTT 做的事?或許,我們可以聚集一群擁有各種想法和專業的人,一同有效率地利用人工智慧解決問題。這個想法我和台灣的科技部門首長談過,也和政委唐鳳、及一些台大從事此領域研究的教授談過。我發現大家都很異常的興奮,感覺就像是:「這太有趣了,我想做這件事,我們一起來做這件事吧!」

所以在 4 月 27 日,我們成立了台灣 AI 實驗室,希望能把這些想法和想像,結合台灣的文化和能量,在台灣拋磚引玉,有機的帶動人工智慧的革命。

有人問我,你覺得結成 AI 實驗室最重要的三項資訊是什麼?

第一:當然,你需要資料(DATA),資料是一切的起點。

沒有資料,你什麼都觀察不到;沒有資料,你什麼事都不能做。有人會問,我沒有資料,那我該怎麼辦?有人會問,我沒有資料,所以我要寫個「網路爬蟲」,像微軟、像 Google 一樣爬完整個網路嗎?

我會說,千萬別這麼做。不要寫爬蟲,也不要擔心自己沒有資料,因為你總是有辦法蒐集資料的:過去 2 年裡,人類製造了人類歷史中 90% 的資料,也就是說,我們在 2 年之前製造的所有資料,只佔現今總資料的 10%。同時,你可以感覺到,網路(Web)資料已經漸漸不再是最重要的。過去,你要查什麼東西,會打開瀏覽器尋找,現在,你會打開手機裡的應用程式查──那些應用程式並不是使用雲端的資料,而是能夠自行蒐集資料。

資料的改變非常快。就像是 1990 年代之時,我們做 PTT、開始有一些與網路有關的想法,當時許多內容業者會挑戰我:你沒有資料授權,你要放什麼上去給別人看?

但今日,如果你在台灣,你可能就會知道,我們一天在 PTT 上創造了多少資料。

因此,不要擔心沒有資料,而是去想怎麼蒐集資料,以及你需要什麼樣的資料。

未來兩年之內,同樣的也會是創造出人類歷史上 90% 資訊量的時代:未來絕大多數的資料,我們根本還沒看到

你可以記下這些數字:今日,全球總計有 20 億支手機,根據預測,到了 2020 年,因為 AI 的興起帶動智慧終端,全球預估會有 250 億個 IoT、智慧裝置──也就是說,到了 2020 年時絕大多數的資料,你現在根本還沒有見過。

我也可以預測,到了 2020 年,當我再來演講時,我同樣會告訴你:「過去 2 年裡,我們創造了人類歷史上 90% 的資料。」

資料是指數增長的,因為人類科技在摩爾定律也是指數增長。所以不要擔心沒有資料,思考你要什麼資料,然後從現在開始蒐集就可以。

從另一個角度來說:過去蒐集的資料,不見得對 AI 的開發有幫助。

舉例來說,1990 年代,認定自己「擁有資料」的是書店和出版商:它們有書、有文本;認為自己「擁有資料」的是電影製片商:它們有電影、有 DVD。

但這些資料如今對隨選瀏覽、隨選觀賞來說並沒有任何幫助──因為如今我們有了 youtube,有了 facebook,有了各式各樣網路新媒體。

AI 革命也會發生同樣的事情:今日你想到的資料,只有單純的文字影像,如果沒有更深層幫助 AI 理解的環境訊息,不見得是最適合 AI 的資料。

最適合 AI 資料的是什麼?環境訊息與智慧(intelligence)又是什麼?

當我今天來到會場,工作人員看到我,會說,「喔,你是 Ethan,你是今天的講者。」這就是智慧。

那什麼不是智慧?

當我今天來到會場,有個機器人跑過來說:「歡迎,請填寫你的資料,你叫什麼名字?」而我輸入"Ethan"之後,它繼續問:「哪一個Ethan?是 Ethan Tu 嗎?是 Ethan XXXX 嗎?」這不是智慧。

為什麼這邊的人看到我之後,可以立刻知道我是 Ethan、Ethan 就是 PTT?因為你已經擁有相關的資訊,你知道我會來參加這場活動。也許你沒有見過我,但你覺得這個人看起來有點 geeky,這個人看起來好像有話想說,好像是下一個講者,應該就是 PTT。

人類的大腦已經受過訓練,可以取得很多話語、甚至是影像之外的資訊。因此,語音辨識、語意理解非常重要,但單有它們也是不夠的,於是我們開始做了影像識別,但以人與電腦所能感受到的訊息作為判斷,遠遠超過影像以及語音。

對產業來說亦是如此,你不只是在蒐集影像、音訊或文字資訊,你是在蒐集所有的資訊──例如所在位置、心跳率等等資訊。

以自動駕駛車為例,你每秒都蒐集了數十億位元(gigabits,與 gigabyte 不同)的資料,你得決定你要儲存哪些資料、處理哪些資料、哪些資料要送進雲端。

能夠方方面面照顧到使用者,不需要使用者提示,這才是現在 AI 要談的「資料」。

你可以想像,兩、三年之後,網際網路上的資料成為小宗,IoT 蒐集的資料將成為大宗。

停止擔心資料,開始思考資料創新:如何做到資料創新?觀察你面對的問題,然後去找尋你需要的資料。

第二:演算法

AlphaGo 可以擊敗人類、微軟語音辨識可以做得比人類還好、影像辨識可以做得比人類還要好,原因之一就是演算法。做到人類專業級的判斷,往往就是一個指標,而用機器代替人做決定就是機器學習的領域,目前最多人在談的機器學習演算法突破,就是 Deep Learning(深度學習),而深度學習改變了我們思考的方式。深度學習傳承過去有的神經網路並不是新事物,但為什麼深度學習近期會有這麼強大的能力?

原因出於幾個根本性的變化。例如,GPU 運算革命給了我們夠強大的運算能力,以及網際網路的興起造就蒐集、累積的資料等等。

思考演算法的時候,你要找出你最有興趣、最具知識的領域。但我建議大家不要跨入那些問題已經解決的領域:例如,AlphaGo 已經在圍棋上擊敗了人類,於是我見到許多「類似 AlphaGo」的團隊,但那沒有用啊,何不找個新問題來解決?新問題永遠都在你身邊,去找出它來吧!

我心目中的第三項重要事物,就是找出、創造「體驗」:

我認為,你今日見到的體驗,未來絕對不是最棒的體驗。這就像是網路革命,它會不斷地迭代(iteration)──AI 革命亦是如此,而且會更快。因為現在我們已經有非常好的工具和平台,我們可以一一嘗試各種想法:

過去,如果你想嘗試什麼,你得買台伺服器、安裝 OS、學習如何跑 Apache。但現在不用了,依照你的需求,你可以使用 AWS、Nvidia Cloud Service 等服務,你可以把系統放在雲端持續運作。

你可能知道 PTT 目前有 3 個站,其中,有一個就放在雲端──這是最不用擔心的站,因為它就是會一直運作。AI 的革命也是,平台會不斷地持續完善,讓大家去嘗試各種的體驗。

因此,好好利用我們現有的資源,一一測試各種想法。

台灣之美:完全不遜全球的基礎實力,和無數優秀的人才,「我們一起做些什麼吧!」

4 月 27 日之後,許多人和我討論,他們能為台灣的 AI 專案做什麼?我們能一起做什麼?

我們和市政府在共同思考與城市有關的想法,也和一些非常知名的產業龍頭一起思考自動駕駛,和非常有能力的產業人士在進行機器人研究。

這就是台灣之美:這是個小地方,但你有各式各樣的專家,而且大多數人是世上最棒的專家:

如果你有個 IoT 想法、你需要感測器,在這裡,你一定找得到,就算他們沒有生產,只要和他們談,他們就會有辦法生產。以 Nvidia 晶片組為例,它們也是在這裡代工,如果你需要某種專門性的晶片組,你也可以在這裡找到 ODM、OEM。

同時,這裡也有最棒的工程師。這非常讓我驚奇。4 月 27 日我們宣布成立 AI 實驗室,距今不過 1 個月,我們開放的工作岡位都已經有人,已經雇到了所有我們需要的人才!

我們宣佈之後,我每週都會收到數千份履歷。

履歷有三個來源:

第一個是台灣科技龍頭裡的軟體人才,他們在硬體上非常有經驗;第二就是剛畢業的學生。深度學習是個新領域,但在台灣,我們有很多好教授在教機器學習與深度學習,也創造了許多優秀的新人才。我同時也收到了很多實習的申請。

看到這些學生的學習成果更讓我感到非常驚奇的是,許多人說 AI 沒有創造能力、沒有辦法感受情緒,但我卻一直見到,有學生試圖解決這些問題,把那當成他們的小專案。由此,你可以看出台灣學生的創意:他們己經在想怎麼解決這些問題,想的甚至比我還要多。

這正是為什麼我會說:我不是在講我的故事,我是在講台灣、講這些優秀人才、講這些好點子的故事。

第三個履歷來源,約 30%,則來自台灣以外的世界各地:我們有來自以色列的履歷,以色列也是個擁有優秀人才的地方;我們有來自英國的履歷,也有來自 Google 等美國科技大公司的履歷。

看到有這麼多優秀的應徵者,我覺得,與我在其他地區雇用的人才相比,台灣人才的水準真的非常高。

人工智能的醫療應用:罕見疾病、基因研究

我們剛剛談了三個必須處理的重大問題:
 
第一是資料
第二是演算法
第三是我們必須找出體驗

接著,我想深入討論其中一個體驗的創新──醫療領域。

其實我或許不是最適合講這個的人,因為我只在 NIH 從事人類基因研究 3 年,有很多醫生可以說得比我更好。

但很有趣的是,我們在 AI 和醫療福利團隊時,我對教授說,應該請你來一同演講,如何利用 AI 使用在醫療產業。

我得到的回應卻是:「我們是鄉民、我們是志願者、我們不想站到前頭,我給你材料,你去講吧!」這也是我發現台灣的另一個有趣之處:這些人擁有大量的知識、能力十足也非常創新,但他們全都都很謙虛,他們不想站到前頭。也有教授告訴我:「你比較適合講,因為你沒有太多的相關知識,所以你講起來反而大家比較容易懂。」

其實,用人工智能改進罕見疾病的基因診斷,這就是我們目前在思考的主要問題之一:許多人聽過罕見疾病,也可能覺得罕見疾病不會影響自己,因為那聽起來有些超現實,然而因為罕見疾病的種類非常多,總體來說還是影響了很多家庭,例如 Deep Genomics 的創辦者 Brendan Frey 就是因為他的小孩有先天的罕見疾病,而基因組定序後,研究人員沒法解釋為什麼他的小孩有問題,所以轉從以深度學習看罕見疾病。

平均每 17 人,就有 1 人患有各自不同的罕見疾病,這個比例其實不低。大多數罕見疾病難以診斷,正是因為其症狀少見,醫生不知道該怎麼辦,也因為其罕見,就很難用更有系統的方式在分子基準上進行診斷。目前只有 25% 的罕見疾病可以在分子基礎上得到診斷,而 30% 的孩子會在 5 歲以前死亡。

目前,80% 的罕見疾病與基因有關

這是基因共同表現(co-expression of genome)最出名的圖,在 1998 年,我們不知道觀察基因能做什麼,我們只知道,如果基因組有相似的功能,它們就會有相似的表現。

發現了共同表現之後,有趣的問題就是,要如何將基因型(genotype)與表現型(phenotype)連結起來。

表現型是指基因如何表現在人的外觀等;基因型則是我們眼中的基因特徵。1999 年,我們已經看出了基因型與表現型之間的連結,也就是說,基因已經可以告訴我們一些與人類有關的事。

問題是,基因就像是外星語言,它告訴你很多事,遠比我們懂得多。我會這麼說明基因組的問題:

每個人擁有兩套染色體,每套含有 30 億個鹼基對,也就是說兩套染色體會有 60 億鹼基對。他有多長?如果一個人一天大約會說出 2 萬字,你把基因組想像成某種語言──得連續說上 800 年。

基因告訴你大量的訊息,全都在一個人的身體裡,就算只說完一套染色體,也需要 400 年。我想用語音辨識的角度來談這個問題,也許會和一些醫學專家不同,但也是一種新的思考方式:

要設計模型,先讓我說明一下基因組的運作。每個人都有兩套染色體,每套有 23 個染色體,染色體含有 DNA,DNA 透過轉錄形成信使 RNA,這些 RNA 則帶有形成蛋白所需的訊息,不同的蛋白則會對人體功能產生不同的影響。

事實上,蛋白質序列也可以看成是一另種語言,只是我們不懂。當我們遇到一個我們不懂的「外星語言」時,嘗試分析的第一件事就是:假設這句話代表某 A,那句話也代表某 A,那我們就將所有可能用來指涉某 A 的文字放在一起,找出相似和相異的地方。

這就是我們一開始分析蛋白質序列和基因序列的方式,我們也可以用生物學的方式來呈現,但我會避免使用生物學式的結構,因為那比較難以電腦化的手段來處理。

我們還會使用另一個方法,來縮減問題的規模:每套染色體有 30 億鹼基對,這資料量非常大,但在大多數人身上,基因組大致是相同的,因此,在基因組研究上,我們通常有參照基因組。例如有一個名為 hg38 的基因組,可以用來與你的基因組相比較,找出兩者的差異,不過,這樣的資料量還是不少,Human Longevity 針對 10,000 人進行基因定序,結果發現,每定序一套新的基因組,就會發現 0.7Mb 的新序列(與 hg38 相較),每定序一套新的基因組平均會找出 8,579 個新的變異。

用傳統「機器學習」理解基因研究,找出變異有挑戰

台灣也有類似的嘗試,台灣人體生物資料庫(Taiwan Biobank),這個機構試圖從零開始蒐集基因組資料,分析台灣人體生物資料庫的資料後,我們發現,台灣人的平均變異量為擁有 4.7M。

你可能會問,為什麼我們要看變異?因為這會影響蛋白生產,但也不是每個變異都很重要,轉錄因子結合位(Transcription factor binding site,TFBS),轉錄是基因轉為信使 RNA 的過程如果失敗了,就不會生產正確的蛋白,TFBS 就像是個鎖,有了轉錄因子,你就可以開啟蛋白生產,反之,蛋白生產可能就會出問題。

這個鎖,TFBS 有個模式,我們稱之為 motif──我們可以定義,如果這個基因序列改變了,就會影響轉錄因子,有了 TFBS 和它的變異,我們就能試圖尋找變異的衝擊。

我們回頭思考,該如何以基因表現為基礎診斷罕見疾病?這問題也等於是:有了一個人的全數基因序列之後,我們能否解答這基因說了甚麼話?哪些話是關鍵?影響到蛋白質的生成,而蛋白質的生成又告訴生物體什麼,以至於他因此生病?(當然,假設是這個病是由基因造成)

很早期的全基因組關聯分析(Genome-wide association study),就是希望找出基因組變異與罕見疾病,也就是表現型之間的關聯,但如果你從機器學習角度思考,那就像是我們早期在 AI 上使用的專家系統(expert system)等級,它基本上是在考慮整個基因序列:如果某幾個人擁有同樣的表現型,我們就能找出哪個基因組具有顯著重要性,然而,這個做法不是非常有用,因為它可能會受到許多因素影響,例如,如果某個表現型是受到數個變異的影響呢?又如果,這和基因的位置無關,而是與 TFBS pattern 有關呢?

用「深度學習」的方式,嘗試破解基因密碼

因此,為了能有更好的結果,在台灣,我們也有一些初期想法,台灣大學的一位教授,就嘗試建立深度學習神經網路來理解 DNA,我們如何利用深度學習,來尋找有關的 DNA 結合點?

你可以這樣想,它會是整個架構中的一個組件,幫助我們找出基因型與表現型之間的聯結,我們得擁有各個組件,從 DNA 到 RNA,從RNA 到蛋白,從蛋白到蛋白,把各種人體內可能出現的互動組合在一起,然後我們才能建構整個多層類神經架構。

接著我們再來思考診斷罕見疾病的過程,過程會像是這樣。第一,我們得為病患定序,我們已經有台灣人體生物資料庫,也有知道如何定序的人才,所以我們可以做定序。

定序之後就是變異辨認(Variant Calling),完成變異註解(Variant Annotation)之後,就可以使用神經網路,神經網路的輸入(Input)是基因序列;輸出(output)則是表現型,內部則會放進各個組件,包括基因組與 RNA、RNA 與蛋白、蛋白與蛋白間的互動等。

2014 年,有一份論文指出,基因編輯確實有可能,如果這個過程(指前述的罕見疾病診斷過程)成真,我們就知道基因組出了什麼問題,也就有機會編輯基因,治癒罕見疾病

這在其他方面也很有用,例如,我們也可以先把想改變的部分放進系統,看看這樣的編輯是否真的能治癒疾病,我們稱作「精準醫療」,也就是你確信療法有效,才治療病患。過去的作法,是會嘗試各種醫療,看看哪一種有效;精準醫療則是在給你藥物之前,已經先進行過模擬,找出能夠治療你疾病的方法。

深度學習直到 2012 年才開始起飛。2 年前,我們已經看到第一份使用深度學習處理基因組的論文。這份論文和我們剛才提的想法有相似的地方,首先計算 motif,再將 motif 放進多層隱藏層,再用回饋迴圈更新、改善神經網路。

基因組研究已經起動,由於基因定序的成本已經下滑,結合台灣的醫療專業人才,我們有很好的教授、有很好的醫院、我們有台灣人體生物資料庫,我們有很棒的工程師,了解如何做深度學習,我們可以把這一切結合,思考如何一同解決罕見疾病問題。

用台灣「專業鄉民」的力量,共同解決世紀的難題

AI 實驗室成立至今不過一個月,我們已經有一群人一同思考基因組診斷問題,也已經有醫生和教授表示投入的意願。他們願意投入,只因為他們想解決問題,他們覺得這是個很棒的挑戰,他們想解決這個世紀難題。

這就是我們想在台灣推廣的,以「專業鄉民的力量」解決世紀的問題。

我們要想的是怎麼利用已有的基礎建設,結合很好的人才,串聯機構,例如台灣人體生物資料庫,健保局有很多資料,我們要怎麼把它們結合在一起?當然,這當中會有一些醫療倫理、法律和隱私問題,我們可以一同解決,直到真的可以在基因組研究領域,做一些對人類未來有利的事。

最後我回顧一下基因組研究的歷史:過去我在研究的誕生地 NIH,這個階段花費的資金非常巨大,但這個錢是由美國政府出的,過程我們經歷過許許多多的嘗試。現在,AI 深度學習帶領基因研究時機已經到來,我們應該加入、使用我們的深度學習方式,在台灣為所有人的基因組定序,試圖從中找出有趣的事物,解決罕見疾病困難的遺傳診斷。

我簡介了一下基因研究,你可以見到,我們在一個月內就組成了 AI 實驗室,在各個領域也都有很不錯的專業人才交流,我們想把大家集結在一起,做有意義的事。

基因組新研究計畫,正在展開

從這個基因組計畫我們可以發現:

1. 不要擔心你現在沒有基因組的資料(DATA)。想一想,基因組定序的成本已經降到約 1,000 美元,這幾乎就是基因組序列資料要起飛的時刻。真的不用擔心沒有資料,台灣人類生物資料庫以及世界上的各個開放式資料庫,它們都已經有基因組資料了。只要你有相關知識、真的想做點什麼,你就可以開始從一些既有資料開始著手。

2. 深度學習的進步,可以使用我們先前無法處理的方式進行研究。深度學習可以從分子層級進行模擬,我們真的不知道分子間影響的重要性,但沒有關係,我們只要定義這些 DNA、mRNA 蛋白質的交互模型把資料放進去,只要我們訓練好完整的 AI 學習模式,我們就能回溯到源頭,看看是哪些基因特質造成了罕見疾病,因此,深度學習和基因組有如天作之合。

但是在深度學習之前,你得先跑基因組定序,你要確保擁有足夠的運算能力,因為基因定序是個大數據問題,你也需要有足夠運算能力的平台才能訓練深度學習,如果依照後摩爾定律在 GPU,以及基因組定序的成本,深度學習等事物持續起飛,我可以預測,接下來幾年內,深度學習的 AI(AI for Deep Learning)在基因問題會變成非常有趣的領域。

我想,現在世界上有幾間公司,也正試圖利用深度學習來解決基因組問題,但都是以較封閉的方法進行。

但或許因為我出身軟體公司、並且投入 PTT。我的看法是,以我在軟體公司的感想,要成為成功的軟體公司,特別是在新領域,你最需要做到的,就是開放性。

新時代、新領域、新挑戰之中,我相信做大事需要保持開放性

不要把你研究的東西藏起來,一同工作、一同解決問題、一同發表結果、分享結果,比如基因組問題是個龐大的問題,你需要各種專才、各種人,只有單一領域的專業是絕對不夠的。如果我們想在基因組領域成功,希望大家一起參與保持開放性、分享你的結果,然後,我們把所有的成果結合起來,貢獻於人類的未來。

我們也想在這裡推廣一下 AI 實驗室的深度學習基因組計畫。如果你對基因組研究有興趣,又有專業能力,請寫 email 給 genome@ailabes.tw,我會把它轉給對的人、讓他們連絡你。

最後,我們再一次強調我一開始講的:「停止擔心資料」。資料或所謂大數據很重要,它是起點,但不要擔心你有多少資料、把焦點放在蒐集資料。因為各種適合 AI 的新資料,絕大多數都還沒有被我們蒐集。

然後,擁抱各種 IoT 裝置,試圖從中蒐集到你所需要的各種資料後,準備好你的運算能力──正如來到 GTC 的我想知道,我要怎麼應用我的知識和軟體能力,藉由世上最強的運算機器、平台、雲端系統來解決問題。

在這場 AI 革命之中,不是一、兩間公司的革命,而是整個工業的革命。

有些人說這叫「工業 4.0」,我不會用這些名詞。但我可以理解,AI 將會改變工業中的每一個環節──如果你是產業領袖,試試從人類思考的角度,想想如何革新、如何改變你的產業;如果你能比其他產業領袖先一步開始蒐集、分析資料,又能有比其他產業領域更好的結果,你就能帶領下一波 AI 革命。

所以,現在就開始做。

最後,我想給各位看這幾張圖,這些圖也是由 AI 所產生的。

這靈感來自一個很有趣的故事:在 PTT 上有個很有趣的討論串,有個人想找一張美女的照片,所以他用簡單的線條畫了一張圖,突然間,另一個人回應了,貼了一張網路上的相片,問:你是在找這個美女嗎?

有趣的是,一個人只要大略描述一張相片,另一個人就真的可以藉此找出那張相片。

依照這個想法,我們 AI 實驗室裡的兩個成員立刻寫出了程式,使用最先進的技術(nvidia 也有展示這個技術),在這個轉譯(Translation)中,我們用各種人類頭像訓練電腦,告訴電腦人類的頭是什麼模樣,然後,依照這些人頭、人臉,我們只利用簡單的線條,就能讓 AI 產生人臉。

結果相當不錯,你畫出簡單的線條,它就會製造一張像真人一樣的臉。

我們也應用了最近一篇 AI 論文中的 Style transform。因此,你不但可以產生人臉,也可以依照人臉加上各種藝術風格,它運作得很完美,甚至可以直接當家裡的布置。

我們使用 nvidia GPU,組成一台小伺服器,然後就把結果產生出來。你可以想像,警方可以應用這個技術,直接用嫌犯的素描產生人臉;你也可以把它用於藝術,創造一個 AI 藝術家,這個 AI 可以依照描述製作人臉圖畫。

這只是個依照網友描述做的小測試:找出想法、實行,然後做出成果。過程總共只需要幾天。兩年前,這技術可能很多人根本無法想像──AI 革命就是用這樣的速度在前行,而且它會愈來愈快。

因此,現在就參與,現在就加入我們,好好發揮所有的工具、好好發揮你的知識,為人類創造更美好的未來。

謝謝大家。

問答:
 
Mark Hamilton:Ethan,非常棒的簡報,AI 與基因組研究的概念格外吸引我。因為我的兒子剛從大學畢業,拿到資料科學及電腦科學學位,我的女兒畢業、成為小兒科醫生。如果我有機會和他們兩個共進晚餐,我的太太總會不太開心,因為我們談的主題總是和你剛剛談的很像。(笑)

你剛剛提到一件很有趣的事,你說你收到了幾千份履歷,這真的連結到下一個主題:你怎麼開始?這裡有很多新創公司和大公司的人,他們都想雇用人才。你覺得他們該怎麼做?雇用剛大學畢業的學生?還是應該尋找特定的人才?

杜奕瑾 Ethan:以我的觀點來說,兩種人我都會考慮。因為 AI 是非常新的事物,如果有人告訴我他有 30 年的 AI 經驗,我會說,我不在乎,因為我知道 AI 在最近 2-3 年才開始起飛。

我認為,有經驗的開發者和剛畢業的學生都有很好的特質:有經驗的開發者也許可以想出架構、撰寫根本性的程式、知道如何使用雲端服務、如何快速把它變成真正的業務;但以創意來說,我其實偏好雇用剛畢業的學生,台灣的學生獲得很好的教育,擅於思考未來,也有能力動手完成。

Mark Hamilton:我最近雇用了一位博士畢業生,他工作幾個月之後,我和他會談,問他情況怎麼樣。他說,我的主管要我做兩種不同的工作。

我心想,糟了他要和我抱怨了。但沒想到他接著說:「我才剛念完博士,我閉著眼睛也可以完成兩種工作,你可不可以多給我一點事做?」所以我們再找一項工作給他。

你也提到資料,2 年後 90% 的資料都會是新資料,我在想,做機器學習的人非常多,也許有人已經做了 13 年,也許不是深度學習,我常會想,以機器學習來說,你通常是試圖了解資料,然後把資料放進已知的演算法。但深度學習非常不同,你幾乎得忘掉一切你做過的事。你覺得有哪些不同的思考方式可以應用至深度學習?

杜奕瑾:當我在微軟的時候,一開始我們真的嘗試了很多特徵工程(Feature engineering),試圖改善它們等等。

但我們也發現,在深度學習領域,擅長特徵工程的,有時在訓練資料上的表現並不是特別好。因此,我會說,我兩種人才都想要,因為很多時候,我們還是需要特徵工程。這有一點像是,你是要為自己分析成功的方法建立模範,還是要成為良師,只引導結果?良師是在教導特定事務,但你的女兒還是會自然地成長。

版權聲明:本文經專業翻譯,於短時間內耗費巨大心力以聽打方式完成中譯,並經《換日線》編輯及杜奕瑾先生補充與核稿。歡迎轉載本文網址,但未經授權,禁止任何形式之複製和抄襲、改作。

《關聯閱讀》
【獨家】「PTT之父」杜奕瑾卸下微軟小娜研發總監,要建設台灣人工智慧實驗基地
「創世神」談鄉民,PTT創辦人杜奕瑾:鄉民無須完美,不斷進化就好

《作品推薦》
熱情需要自己創造──特效化妝師程薇穎專訪(下)
所有壓力,都是進步的原動力──特效化妝師程薇穎專訪(上)

 

執行編輯:YUKI
核稿編輯:張翔一

Photo Credit:主圖/NVIDIA Taiwan 臉書專頁、附圖/NVIDIA 人工智慧論壇 截圖

畢業就出國