機器學(xué)習(xí)是目前信息技術(shù)中最激動人心的方向之一。在這門課中,你將學(xué)習(xí)到這門技術(shù)的前沿,并可以自己實現(xiàn)學(xué)習(xí)機器學(xué)習(xí)的算法。你或許每天都在不知不覺中使用了機器學(xué)習(xí)的算法每次,你打開谷歌、必應(yīng)搜索到你需要的內(nèi)容,正是因為他們有良好的學(xué)習(xí)算法。谷歌和微軟實現(xiàn)了學(xué)習(xí)算法來排行網(wǎng)頁每次,你用 Facebook 或蘋果的圖片分類程序他能認(rèn)出你朋友的照片,這也是機器學(xué)習(xí)。每次您閱讀您的電子郵件垃圾郵件篩選器,可以幫你過濾大量的垃圾郵件這也是一種學(xué)習(xí)算法。對我來說,我感到激動的原因之一是有一天做出一個和人類一樣聰明的機器。實現(xiàn)這個想法任重而道遠(yuǎn),許多 AI 研究者認(rèn)為,實現(xiàn)這個目標(biāo)最好的方法是通過讓機器試著模仿人的大腦學(xué)習(xí)我會在這門課中介紹一點這方面的內(nèi)容。在這門課中,你還講學(xué)習(xí)到關(guān)于機器學(xué)習(xí)的前沿狀況。但事實上只了解算法、數(shù)學(xué)并不能解決你關(guān)心的實際的問題。所以,我們將花大量的時間做練習(xí),從而你自己能實現(xiàn)每個這些算法,從而了解內(nèi)部機理。
那么,為什么機器學(xué)習(xí)如此受歡迎呢?原因是,機器學(xué)習(xí)不只是用于人工智能領(lǐng)域。我們創(chuàng)造智能的機器,有很多基礎(chǔ)的知識。比如,我們可以讓機器找到 A 與 B 之間的最短路徑,但我們?nèi)匀徊恢涝趺醋寵C器做更有趣的事情,如 web 搜索、照片標(biāo)記、反垃圾郵件。我們發(fā)現(xiàn),唯一方法是讓機器自己學(xué)習(xí)怎么來解決問題。所以,機器學(xué)習(xí)已經(jīng)成為計算機的一個能力。
現(xiàn)在它涉及到各個行業(yè)和基礎(chǔ)科學(xué)中。我從事于機器學(xué)習(xí),但我每個星期都跟直升機飛行員、生物學(xué)家、很多計算機系統(tǒng)程序員交流(我在斯坦福大學(xué)的同事同時也是這樣)和平均每個星期會從硅谷收到兩、三個電子郵件,這些聯(lián)系我的人都對將學(xué)習(xí)算法應(yīng)用于他們自
己的問題感興趣。這表明機器學(xué)習(xí)涉及的問題非常廣泛。有機器人、計算生物學(xué)、硅谷中大量的問題都收到機器學(xué)習(xí)的影響。
這里有一些機器學(xué)習(xí)的案例。比如說,數(shù)據(jù)庫挖掘。機器學(xué)習(xí)被用于數(shù)據(jù)挖掘的原因之一是網(wǎng)絡(luò)和自動化技術(shù)的增長,這意味著,我們有史上最大的數(shù)據(jù)集比如說,大量的硅谷公司正在收集 web 上的單擊數(shù)據(jù),也稱為點擊流數(shù)據(jù),并嘗試使用機器學(xué)習(xí)算法來分析數(shù)據(jù),更好的了解用戶,并為用戶提供更好的服務(wù)。這在硅谷有巨大的市場。再比如,醫(yī)療記錄。隨著自動化的出現(xiàn),我們現(xiàn)在有了電子醫(yī)療記錄。如果我們可以把醫(yī)療記錄變成醫(yī)學(xué)知識,我們就可以更好地理解疾病。再如,計算生物學(xué)。還是因為自動化技術(shù),生物學(xué)家們收集的大量基因數(shù)據(jù)序列、DNA 序列和等等,機器運行算法讓我們更好地了解人類基因組,大家都知道這對人類意味著什么。再比如,工程方面,在工程的所有領(lǐng)域,我們有越來越大、越來越大的數(shù)據(jù)集,我們試圖使用學(xué)習(xí)算法,來理解這些數(shù)據(jù)。另外,在機械應(yīng)用中,有些人不能直接操作。例如,我已經(jīng)在無人直升機領(lǐng)域工作了許多年。我們不知道如何寫一段程序讓直升機自己飛。我們唯一能做的就是讓計算機自己學(xué)習(xí)如何駕駛直升機。手寫識別:現(xiàn)在我們能夠非常便宜地把信寄到這個美國甚至全世界的原因之一就是當(dāng)你寫一個像這樣的信封,一種學(xué)習(xí)算法已經(jīng)學(xué)會如何讀你信封,它可以自動選擇路徑,所以我們只需要花幾個美分把這封信寄到數(shù)千英里外。事實上,如果你看過自然語言處理或計算機視覺,這些語言理解或圖像理解都是屬于 AI領(lǐng)域。大部分的自然語言處理和大部分的計算機視覺,都應(yīng)用了機器學(xué)習(xí)。學(xué)習(xí)算法還廣泛用于自定制程序。每次你去音樂站點,它都會給出其他電影或產(chǎn)品或音樂的建議,這是一種學(xué)習(xí)算法。仔細(xì)想一想,他們有百萬的用戶;但他們沒有辦法為百萬用戶,編寫百萬個不同程序。軟件能給這些自定制的建議的唯一方法是通過學(xué)習(xí)你的行為,來為你定制服務(wù)。
最后學(xué)習(xí)算法被用來理解人類的學(xué)習(xí)和了解大腦。
我們將談?wù)撊绾斡眠@些推進我們的 AI 夢想。幾個月前,一名學(xué)生給我一篇文章關(guān)于最頂尖的 12 個 IT 技能。擁有了這些技能 HR 絕對不會拒絕你。這是稍顯陳舊的文章,但在這個列表最頂部就是機器學(xué)習(xí)的技能。