Diagram illustrating the relationship between Artificial Intelligence (AI), Machine Learning (ML), and Deep Learning (DL) as concentric circles, with AI being the largest and Deep Learning the smallest and innermost.
Diagram illustrating the relationship between Artificial Intelligence (AI), Machine Learning (ML), and Deep Learning (DL) as concentric circles, with AI being the largest and Deep Learning the smallest and innermost.

# ปัญญาประดิษฐ์และการเรียนรู้เชิงลึก: ทำความเข้าใจแก่นแท้ของ AI

ปัญญาประดิษฐ์ (AI) ถูกมองว่าเป็นทั้งผู้บุกเบิกอนาคตและสิ่งมหัศจรรย์ที่อยู่ในนิยายวิทยาศาสตร์ ความจริงแล้ว AI ได้แทรกซึมเข้ามาในชีวิตประจำวันของเราแล้ว อย่างไรก็ตาม คำว่า “AI” นั้นครอบคลุมแนวทางต่างๆ มากมาย และการทำความเข้าใจความแตกต่างเหล่านี้มีความสำคัญอย่างยิ่ง

เมื่อโปรแกรม AlphaGo ของ Google DeepMind เอาชนะ ลี เซดอล ผู้เชี่ยวชาญเกมโกะ หัวข้อข่าวต่างๆ ได้ประกาศชัยชนะของ AI, การเรียนรู้ของเครื่อง และการเรียนรู้เชิงลึก แม้ว่าทั้งสามคำนี้จะถูกใช้เพื่ออธิบายความสำเร็จของ AlphaGo แต่ก็เป็นแนวคิดที่แตกต่างกันแต่เชื่อมโยงกัน

ลองนึกภาพ AI, การเรียนรู้ของเครื่อง และการเรียนรู้เชิงลึกเป็นวงกลมซ้อนกัน AI ซึ่งเป็นแนวคิดที่เก่าแก่ที่สุดและครอบคลุมที่สุด เป็นวงกลมที่ใหญ่ที่สุด การเรียนรู้ของเครื่องซึ่งเป็นการพัฒนาในภายหลัง อยู่ภายใน AI และสุดท้าย การเรียนรู้เชิงลึก ซึ่งเป็นเครื่องยนต์ขับเคลื่อนการปฏิวัติ AI ในปัจจุบัน อยู่ตรงกลางซ้อนอยู่ภายในทั้ง AI และการเรียนรู้ของเครื่อง

วิวัฒนาการของ AI: จากคำสัญญาสู่อนุภาพในปัจจุบัน

แนวคิดของ AI ได้ดึงดูดจินตนาการและเป็นเชื้อเพลิงให้กับห้องปฏิบัติการวิจัยมาตั้งแต่การก่อตั้งอย่างเป็นทางการที่การประชุม Dartmouth ในปี 1956 ตลอดหลายทศวรรษที่ผ่านมา เส้นทางของ AI ได้แกว่งไปมาอย่างรุนแรงระหว่างวิสัยทัศน์ในอุดมคติและการถูกมองว่าเป็นเพียงกระแสที่ไม่สมจริง จนกระทั่งประมาณปี 2012 ความเป็นจริงคือการผสมผสานของทั้งสองอย่าง—การใช้งานจริงที่จำกัดควบคู่ไปกับศักยภาพทางทฤษฎีที่มหาศาล

อย่างไรก็ตาม สภาพแวดล้อมได้เปลี่ยนแปลงไปอย่างมาก โดยเฉพาะอย่างยิ่งหลังปี 2015 ซึ่งเป็นจุดเริ่มต้นของการฟื้นตัวอย่างรวดเร็วของ AI การบูมนี้ส่วนใหญ่เกิดจากการใช้งาน GPU (หน่วยประมวลผลกราฟิก) ที่ทรงพลังอย่างแพร่หลาย ซึ่งช่วยเร่งการประมวลผลแบบขนานอย่างมาก ทำให้เร็วขึ้น ถูกกว่า และมีประสิทธิภาพมากขึ้น พร้อมกันนั้น การระเบิดของข้อมูลขนาดใหญ่—ข้อมูลดิจิทัลจำนวนมหาศาล รวมถึงรูปภาพ ข้อความ และข้อมูลธุรกรรม—ได้เป็นเชื้อเพลิงให้กับอัลกอริทึม AI ที่จำเป็นในการเรียนรู้และพัฒนา

มาติดตามการเดินทางจากอดีตที่ค่อนข้างน่าผิดหวังของ AI ไปสู่พลังการเปลี่ยนแปลงในปัจจุบัน ซึ่งขับเคลื่อนโดยความก้าวหน้าในการเรียนรู้เชิงลึก

ปัญญาประดิษฐ์: การเลียนแบบความสามารถทางความคิดของมนุษย์ในเครื่องจักร

ย้อนกลับไปในการประชุมที่สำคัญในปี 1956 แรงบันดาลใจในการก่อตั้ง AI คือการสร้างเครื่องจักรที่ซับซ้อนซึ่งมีความสามารถในการจำลองความฉลาดของมนุษย์ เป้าหมายที่ทะเยอทะยานนี้มักเรียกว่า “AI ทั่วไป”—การจินตนาการถึงเครื่องจักรที่มีสติสัมปชัญญะ การใช้เหตุผล และความสามารถทางประสาทสัมผัสในระดับมนุษย์ AI ทั่วไป ซึ่งเป็นอาณาจักรของไอคอนนิยายวิทยาศาสตร์อย่าง C-3PO และเทอร์มิเนเตอร์ ยังคงเป็นเรื่องทางทฤษฎีเป็นส่วนใหญ่ แม้จะมีการวิจัยมาหลายทศวรรษ แต่การบรรลุ AI ทั่วไปที่แท้จริงยังคงเป็นสิ่งที่อยู่ไกลออกไป

ในทางตรงกันข้าม “AI แบบแคบ” แสดงถึงความเป็นจริงของ AI ในปัจจุบัน AI แบบแคบมุ่งเน้นไปที่เทคโนโลยีที่ออกแบบมาเพื่อให้มีความเชี่ยวชาญในงานเฉพาะอย่าง มักจะเหนือกว่าความสามารถของมนุษย์ในโดเมนที่กำหนดไว้ ตัวอย่างของ AI แบบแคบในการใช้งาน ได้แก่ ระบบการจำแนกรูปภาพที่ขับเคลื่อนแพลตฟอร์มต่างๆ เช่น Pinterest และเทคโนโลยีการจดจำใบหน้าที่ใช้โดย Facebook

แอปพลิเคชัน AI แบบแคบเหล่านี้แสดงให้เห็นถึงด้านต่างๆ ของความฉลาดของมนุษย์ แต่ “ความฉลาด” นี้ทำได้อย่างไร นี่นำเราไปสู่ชั้นถัดไป: การเรียนรู้ของเครื่อง

การเรียนรู้ของเครื่อง: การเพิ่มพลังให้กับ AI ผ่านการเรียนรู้จากข้อมูล

แก่นแท้ของ การเรียนรู้ของเครื่อง นั้นใช้อัลกอริทึมในการวิเคราะห์ข้อมูล เรียนรู้จากข้อมูล และจากนั้นทำการตัดสินใจหรือทำนายเกี่ยวกับโลก แทนที่จะอาศัยคำแนะนำที่เขียนด้วยมืออย่างชัดเจนสำหรับทุกงาน อัลกอริทึมการเรียนรู้ของเครื่องจะได้รับ “การฝึกฝน” โดยใช้ชุดข้อมูลขนาดใหญ่ กระบวนการฝึกฝนนี้ช่วยให้เครื่องเรียนรู้วิธีการทำงานเฉพาะอย่างได้โดยอัตโนมัติ

การเรียนรู้ของเครื่องพัฒนาขึ้นโดยตรงจากชุมชนวิจัย AI ในยุคแรก ตลอดหลายปีที่ผ่านมา มีการใช้วิธีการทางอัลกอริทึมต่างๆ มากมาย รวมถึงการเรียนรู้ต้นไม้การตัดสินใจ การเขียนโปรแกรมตรรกะแบบอุปนัย การจัดกลุ่ม การเรียนรู้การเสริมแรง และเครือข่ายแบบเบย์เซียน อย่างไรก็ตาม เทคนิคการเรียนรู้ของเครื่องในยุคแรกๆ เหล่านี้ไม่สามารถบรรลุ AI ทั่วไปได้และยังดิ้นรนที่จะส่งมอบแอปพลิเคชัน AI แบบแคบที่เชื่อถือได้อย่างสม่ำเสมอ

เพื่อเจาะลึกในการเรียนรู้เชิงลึก ให้สำรวจตอนที่ 113 ของพอดแคสต์ AI ของเราซึ่งมี Will Ramey จาก NVIDIA ร่วมด้วย

พอดแคสต์ AI · ทำความเข้าใจ AI กับ Will Ramey จาก NVIDIA – ตอนที่ 113

ตลอดหลายปีที่ผ่านมา วิสัยทัศน์คอมพิวเตอร์ ได้เกิดขึ้นเป็นพื้นที่ใช้งานที่มีแนวโน้มที่ดีสำหรับการเรียนรู้ของเครื่อง อย่างไรก็ตาม ระบบวิสัยทัศน์คอมพิวเตอร์ในยุคแรกๆ ยังคงต้องการการเขียนโค้ดด้วยมืออย่างกว้างขวาง นักพัฒนาจะสร้างตัวจำแนกที่เขียนด้วยมืออย่างยากลำบาก เช่น ตัวกรองการตรวจจับขอบเพื่อระบุขอบเขตของวัตถุ อัลกอริทึมการตรวจจับรูปร่างเพื่อจดจำรูปแบบทางเรขาคณิต และการจดจำตัวอักษรเพื่อถอดรหัสข้อความ ตัวจำแนกที่สร้างขึ้นด้วยมือเหล่านี้จะถูกรวมเข้ากับอัลกอริทึมที่มุ่งเป้าไปที่การตีความรูปภาพและ “การเรียนรู้” ในการจดจำวัตถุต่างๆ เช่น ป้ายหยุด

แม้จะใช้งานได้ แต่ระบบในยุคแรกๆ เหล่านี้ยังห่างไกลจากความสมบูรณ์ ประสิทธิภาพลดลงอย่างมากในสภาพแวดล้อมที่ท้าทาย เช่น หมอกหรือสิ่งกีดขวางบางส่วน ข้อจำกัดโดยธรรมชาติของระบบที่เปราะบางและมีข้อผิดพลาดเหล่านี้ อธิบายว่าเหตุใดวิสัยทัศน์คอมพิวเตอร์จึงล้าหลังความสามารถของมนุษย์จนกระทั่งความก้าวหน้าในเร็วๆ นี้

ชิ้นส่วนที่หายไปที่สำคัญคือเวลาและอัลกอริทึมการเรียนรู้ที่เหมาะสม — เข้าสู่การเรียนรู้เชิงลึก

การเรียนรู้เชิงลึก: การปฏิวัติการเรียนรู้ของเครื่องด้วยเครือข่ายประสาทเทียม

วิธีการทางอัลกอริทึมอีกวิธีหนึ่งที่เกิดขึ้นในช่วงแรกๆ ของการเรียนรู้ของเครื่อง เครือข่ายประสาทเทียม ได้รับทั้งคำสัญญาและความไม่สนใจในช่วงหลายทศวรรษที่ผ่านมา เครือข่ายประสาทเทียม ได้รับแรงบันดาลใจจากความเข้าใจของเราเกี่ยวกับโครงสร้างทางชีววิทยาของสมองมนุษย์—เครือข่ายที่ซับซ้อนของเซลล์ประสาทที่เชื่อมต่อกัน อย่างไรก็ตาม ไม่เหมือนกับสมองทางชีววิทยาที่มีการเชื่อมต่อของเซลล์ประสาทที่ยืดหยุ่น เครือข่ายประสาทเทียมมักจะมีโครงสร้างเป็นชั้นๆ ที่แยกจากกัน โดยมีการเชื่อมต่อและทิศทางการไหลของข้อมูลที่กำหนดไว้

ในกระบวนการเรียนรู้เชิงลึกทั่วไปสำหรับการจดจำภาพ ภาพจะถูกแบ่งออกเป็นกระเบื้อง ซึ่งจะถูกป้อนเข้าไปในชั้นแรกของเครือข่ายประสาท เซลล์ประสาทแต่ละเซลล์ในชั้นแรกจะประมวลผลข้อมูลนำเข้าและส่งข้อมูลไปยังชั้นถัดไป กระบวนการประมวลผลแบบหลายชั้นนี้จะดำเนินต่อไปจนกว่าชั้นสุดท้ายจะสร้างเอาต์พุตที่ต้องการ

เซลล์ประสาทแต่ละเซลล์จะกำหนด “น้ำหนัก” ให้กับข้อมูลนำเข้า ซึ่งแสดงถึงความเกี่ยวข้องกับงาน เอาต์พุตสุดท้ายจะถูกกำหนดโดยการรวมข้อมูลนำเข้าที่มีน้ำหนักเหล่านี้ ลองพิจารณาตัวอย่างป้ายหยุดอีกครั้ง เครือข่ายประสาทที่วิเคราะห์ภาพป้ายหยุดจะตรวจสอบแอตทริบิวต์ต่างๆ—รูปทรงแปดเหลี่ยม สีแดง ตัวอักษรที่โดดเด่น ขนาดมาตรฐาน และการเคลื่อนไหว (หรือขาดการเคลื่อนไหว) เป้าหมายของเครือข่ายคือการกำหนดว่าภาพนั้นเป็นป้ายหยุดหรือไม่ มันสร้าง “เวกเตอร์ความน่าจะเป็น” ซึ่งโดยพื้นฐานแล้วเป็นการเดาที่มีข้อมูลสูงมากตามแอตทริบิวต์ที่มีน้ำหนัก ตัวอย่างเช่น ระบบอาจแสดงความมั่นใจ 86% ว่าเป็นป้ายหยุด ความมั่นใจ 7% ว่าเป็นป้ายกำหนดความเร็ว และความมั่นใจ 5% ว่าเป็นวัตถุที่ไม่เกี่ยวข้อง จากนั้นโครงสร้างเครือข่ายจะได้รับแจ้งว่าการคาดการณ์ของมันถูกต้องหรือไม่

ในอดีต เครือข่ายประสาทเทียมถูกชุมชนวิจัย AI ปฏิเสธไปเป็นส่วนใหญ่ แม้จะมีต้นกำเนิดในยุคแรกๆ ก็ตาม พวกมันแสดงให้เห็นถึง “ความฉลาด” ที่จำกัดและต้องการการคำนวณอย่างมาก ทำให้ไม่เหมาะสมสำหรับการใช้งานส่วนใหญ่ อย่างไรก็ตาม กลุ่มที่ทุ่มเทนำโดย Geoffrey Hinton ที่มหาวิทยาลัย Toronto ได้ทุ่มเท พวกเขาประสบความสำเร็จในการจัดเรียงอัลกอริทึมเครือข่ายประสาทแบบขนานสำหรับซูเปอร์คอมพิวเตอร์ แสดงให้เห็นถึงศักยภาพของแนวคิด อย่างไรก็ตาม การถือกำเนิดของ GPU ที่ทำให้ปลดล็อกคำสัญญาของเครือข่ายประสาทได้อย่างแท้จริง

กลับไปที่ตัวอย่างป้ายหยุด ในขั้นต้น เครือข่ายประสาทมีแนวโน้มที่จะทำผิดพลาดหลายครั้งในระหว่างขั้นตอนการฝึกฝน การฝึกฝนที่มีประสิทธิภาพต้องการการเปิดเผยเครือข่ายต่อข้อมูลจำนวนมหาศาล—หลายแสนแม้กระทั่งหลายล้านภาพ ผ่านการฝึกฝนอย่างกว้างขวางนี้ น้ำหนักที่กำหนดให้กับข้อมูลนำเข้าของเซลล์ประสาทจะได้รับการปรับแต่งด้วยความแม่นยำที่เพิ่มขึ้นจนกระทั่งเครือข่ายสามารถระบุป้ายหยุดได้อย่างถูกต้องในสภาพต่างๆ—หมอก แสงแดด ฝน ฯลฯ ณ จุดนี้ เครือข่ายประสาทได้ “สอนตัวเอง” ให้จดจำป้ายหยุด หรือใบหน้าของมนุษย์ (ตามที่ใช้ในการจดจำใบหน้าของ Facebook) หรือแม้แต่แมว ตามที่ Andrew Ng ได้แสดงให้เห็นที่ Google ในปี 2012

ส่วนสำคัญของ Ng คือการปรับขนาดเครือข่ายประสาทอย่างมาก—เพิ่มจำนวนชั้นและเซลล์ประสาท—และการฝึกฝนพวกมันบนชุดข้อมูลขนาดใหญ่ ในงานที่ก่อให้เกิดการเปลี่ยนแปลงของเขา Ng ได้ใช้ภาพ 10 ล้านภาพจากวิดีโอ YouTube การ “ทำให้ลึก” ของเครือข่ายประสาทนี้ทำให้เกิดคำว่า “การเรียนรู้เชิงลึก” เน้นชั้นต่างๆ ภายในเครือข่ายเหล่านี้

ปัจจุบัน การจดจำภาพที่ใช้พลังงานจากการเรียนรู้เชิงลึกในบางสถานการณ์นั้นเหนือกว่าความแม่นยำของมนุษย์ สิ่งนี้ขยายออกไปเกินกว่าการจดจำวัตถุง่ายๆ เช่น แมวไปจนถึงงานที่ซับซ้อน เช่น การระบุตัวบ่งชี้มะเร็งในตัวอย่างเลือดและเนื้องอกในภาพ MRI AlphaGo ของ Google ได้เรียนรู้เกมโกะที่ซับซ้อนโดยการเล่นกับตัวเองหลายครั้งอย่างต่อเนื่อง ปรับแต่งเครือข่ายประสาทของมันผ่านการเล่นด้วยตนเอง

ขอบฟ้าที่สดใสของ AI ซึ่งขับเคลื่อนโดยการเรียนรู้เชิงลึก

การเรียนรู้เชิงลึกมีบทบาทสำคัญในการตระหนักถึงศักยภาพที่ใช้งานได้จริงของการเรียนรู้ของเครื่อง และในที่สุดก็เป็นสาขาที่กว้างขึ้นของ AI ความสามารถของการเรียนรู้เชิงลึกในการแยกงานที่ซับซ้อนออกเป็นส่วนๆ เปิดประตูสู่อาร์เรย์ที่หลากหลายของแอปพลิเคชันที่ช่วยเหลือเครื่องจักร ซึ่งหลายๆ อย่างกำลังกลายเป็นความจริง รถยนต์ไร้คนขับ การดูแลสุขภาพเชิงป้องกันที่ได้รับการปรับปรุง และระบบการแนะนำที่ปรับแต่งให้เหมาะสมมากขึ้นนั้นมีอยู่แล้วหรือกำลังจะมาถึงอย่างรวดเร็ว AI ไม่ใช่แค่จินตนาการในอนาคตอีกต่อไป มันคือปัจจุบันและอนาคต ด้วยการเรียนรู้เชิงลึกเป็นแรงขับเคลื่อน AI อาจเข้าใกล้วิสัยทัศน์นิยายวิทยาศาสตร์ที่เราเพลิดเพลินมานาน ผู้ช่วยที่เป็นประโยชน์แบบ C-3PO? ได้โปรด เทอร์มิเนเตอร์? บางทีเราอาจจะไม่ต้องการสิ่งนั้นก็ได้

พอดแคสต์ AI · ทำความเข้าใจ AI กับ Will Ramey จาก NVIDIA – ตอนที่ 113

Comments

No comments yet. Why don’t you start the discussion?

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *