Generative AI
นิยามและความสำคัญ
Generative AI (GenAI) รับเอาข้อมูลที่มีอยู่ เรียนรู้จากข้อมูลนั้น แล้วสร้างข้อมูลที่มีลักษณะคล้ายคลึงกัน เช่นการสร้างข้อความ รูปภาพ วิดีโอ เสียง และโค้ดคอมพิวเตอร์
GenAI กำลังเปลี่ยนโลก
ระบบ AI แบบดั้งเดิมและการเรียนรู้ของเครื่องจะจดจำรูปแบบในข้อมูลเพื่อนำมาทำนายผลลัพธ์ แต่ปัญญาประดิษฐ์แบบรู้สร้างนั้นไม่ใช่แค่เพียงการทำนายเท่านั้น แต่ยังสร้างข้อมูลใหม่เป็นผลลัพธ์หลักอีกด้วย ลองจินตนาการว่าคุณได้รับข้อความสุนทรพจน์เต็มรูปแบบเพียงไม่กี่วินาทีหลังจากป้อนคำอธิบายแนวคิดของคุณไม่กี่คำลงในแชตบอต (หรือเครื่องมืออื่นๆ เช่น ChatGPT) การสร้างดนตรี ศิลปะ หรือรูปภาพจากคำอธิบายที่เป็นข้อความ หรือการพัฒนากลยุทธ์ทางธุรกิจผ่านการสนทนาโต้ตอบโดยใช้เครื่องมือ Generative AI Bloomberg Intelligence พบว่า GenAI อาจกลายเป็นตลาดมูลค่า 1.3 ล้านล้านดอลลาร์ภายในปี 2032
การประยุกต์ใช้ Generative AI ในโลกจริง
Generative AI คาดว่าจะปรับโฉมอนาคตของเราในรูปแบบที่คาดการณ์ได้และไม่สามารถจินตนาการได้ ในวิดีโออธิบายนี้ คุณจะได้ยินตัวอย่างจริงของ Generative AI ที่ครอบคลุมอุตสาหกรรมและกรณีทางธุรกิจโดยใช้โมเดลภาษาขนาดใหญ่ (LLM) การสร้างข้อมูลสังเคราะห์ และ Digital Twins นอกจากนี้คุณยังจะได้เรียนรู้เกี่ยวกับข้อควรพิจารณาและความเสี่ยงที่สำคัญในการนำเทคโนโลยี Generative AI มาใช้ เช่น ความลำเอียง การสร้างข้อมูลผิดพลาด การรักษาความเป็นส่วนตัวของข้อมูล และความปลอดภัยของข้อมูล
วิวัฒนาการของ Generative AI
แม้ว่า Generative AI จะสร้างปรากฏการณ์ไปทั่วโลก แต่ก็ไม่ใช่เรื่องใหม่ เพราะ Generative AI สร้างขึ้นจากเทคโนโลยีที่เราใช้กันมานานหลายทศวรรษแล้ว ไม่ว่าจะเป็น AI การเรียนรู้ของเครื่อง และวิธีการทางสถิติ ต้นกำเนิดของ Generative AI สามารถสืบย้อนกลับไปได้ไกลกว่านี้ แต่เราจะเริ่มต้นด้วยปี 1966 และ แชตบอตหนึ่งที่ชื่อว่า ELIZA
Joseph Weizenbaum ผู้สร้าง ELIZA ได้ออกแบบแชตบอตนี้ให้เลียนแบบนักจิตบำบัดแนวโรเจอร์ที่เลียนแบบคำพูดของคนไข้ ELIZA ใช้การจับคู่รูปแบบเพื่อทำภารกิจนี้ให้สำเร็จ ELIZA เป็นหนึ่งในโปรแกรมแรกๆ ที่พยายามทำการทดสอบทัวริง ซึ่งเป็นเกมเลียนแบบที่ทดสอบความสามารถของเครื่องในการแสดงพฤติกรรมอัจฉริยะเช่นเดียวกับมนุษย์
ในช่วงทศวรรษที่ 1970 ถึง 1990 วิธีการวิเคราะห์ข้อมูลข้อความที่ไม่มีโครงสร้างได้พัฒนาไปมาก ได้เห็นการเติบโตของเครือข่ายเชิงความหมาย ออนโทโลยี เครือข่ายเป็นกลางแบบเกิดซ้ำ และอีกมากมาย ตั้งแต่ปี 2000 ถึงปี 2015 การสร้างโมเดลภาษาและการฝังคำได้รับการพัฒนาขึ้น และ Google แปลภาษาก็ได้ถือกำเนิดขึ้นในช่วงนี้
ในปี 2014 Ian Goodfellow และทีมงานได้พัฒนา โครงข่ายปฏิปักษ์ก่อกำเนิด (GAN) โดยตั้งค่าเครือข่ายเป็นกลางสองเครือข่ายให้แข่งขันกันเอง ซึ่งนับว่าเป็นการฝึกเครือข่ายด้วยเช่นกัน เครือข่ายหนึ่งสร้างข้อมูลขึ้นมา ในขณะที่อีกเครือข่ายพยายามตรวจสอบว่าข้อมูลนั้นเป็นของจริงหรือของปลอม โมเดลทรานส์ฟอร์เมอร์เปิดตัวครั้งแรกในปี 2017 โดยมีการรวมกลไกการให้ความใส่ใจในตัวเอง ซึ่งช่วยให้โมเดลสามารถชั่งน้ำหนักความสำคัญของส่วนต่างๆ ของข้อมูลนำเข้าเมื่อทำการพยากรณ์ สถาปัตยกรรมอย่าง BERT และ ELMo ก็ได้รับความนิยมเช่นกัน
โมเดลทรานส์ฟอร์เมอร์ฝึกล่วงหน้าก่อกำเนิด (GPT) ปรากฏขึ้นตามมาหลังจากนั้น โดย GPT รุ่นแรกเปิดตัวในปี 2018 โมเดลแบบรู้สร้างนี้ได้รับการฝึกฝนด้วยข้อมูลข้อความจำนวนมากจากอินเทอร์เน็ต แล้วจึงเริ่มสร้างข้อความที่มีรูปแบบและเนื้อหาคล้ายกับข้อมูลการฝึกด้วยพารามิเตอร์ 117 ล้านตัว ภายในปี 2023 โมเดล GPT ภาษาขนาดใหญ่มีการพัฒนาไปจนถึงจุดที่สามารถทำข้อสอบที่ยาก เช่น ข้อสอบเนติบัณฑิต ได้อย่างมีประสิทธิภาพ
Generative AI ในโลกปัจจุบัน
ใครใช้ Generative AI บ้าง
Generative AI ครอบคลุมอุตสาหกรรมและฟังก์ชันทางธุรกิจที่หลากหลายทั่วโลก เมื่อเทคโนโลยีนี้ได้รับความนิยมมากขึ้นและกระตุ้นการพัฒนา ผู้ช่วย AI ที่มีความเฉพาะทางหลากหลาย จึงก่อให้เกิดความตื่นเต้นและความกลัวในหมู่บุคคล ธุรกิจ และหน่วยงานภาครัฐไปพร้อมกัน ดูว่าในปัจจุบันอุตสาหกรรมต่างๆ ใช้ GenAI อย่างไร
ผลลัพธ์ของ Generative AI นั้น แท้จริงแล้วเป็นการสะท้อนถึงมนุษย์เรา ... ผู้บริโภคจะต้องใช้การคิดวิเคราะห์อย่างมีวิจารณญาณต่อไปทุกครั้งที่โต้ตอบกับ Conversational AI และหลีกเลี่ยง Automation Bias (ความเชื่อที่ว่าระบบเทคนิคมีแนวโน้มที่จะถูกต้องแม่นยำมากกว่ามนุษย์)Reggie Townsend VP of the SAS Data Ethics Practice
ข้อควรพิจารณาทางจริยธรรมสำหรับการใช้ Generative AI ในธุรกิจ
เทคโนโลยีที่มีผลกระทบอย่างลึกซึ้งอย่าง Generative AI นั้นถูกเปรียบเทียบกับการค้นพบที่สำคัญเช่นไฟฟ้าและแท่นพิมพ์ เนื่องจากโมเดล Conversational AI มีศักยภาพในการเพิ่มประสิทธิภาพการทำงานอย่างมาก จึงได้รับความนิยมเพิ่มขึ้นอย่างรวดเร็ว ในขณะเดียวกันก็เกิดความกังวลเกี่ยวกับจริยธรรมของ AI ความเป็นส่วนตัวของข้อมูล ความถูกต้อง การสร้างข้อมูลผิดพลาด และความลำเอียง ด้วยความสามารถที่พัฒนาอย่างต่อเนื่องที่เลียนแบบปัญญามนุษย์ GenAI จึงทำให้เกิด ความวิตกกังวลเกี่ยวกับ AI ขึ้นมากมาย และก่อให้เกิดการถกเถียงกันว่าควรใช้และกำกับดูแล AI อย่างไร
เรียนรู้ว่าทำไมถึงจำเป็นต้อง ใช้ระบบ AI ที่เชื่อถือได้ ซึ่งได้รับการออกแบบมาเพื่อให้คำนึงถึงมนุษย์ ความครอบคลุม และความรับผิดชอบร่วมกัน
Generative AI ทำงานอย่างไร
ตัวอย่างเทคโนโลยี Generative AI ที่นิยมบางส่วน ได้แก่ DALL-E ซึ่งเป็นระบบสร้างรูปภาพจากคำสั่งข้อความ, ChatGPT (ระบบสร้างข้อความ), แชตบอต Google Bard และ Bing เครื่องมือค้นหาที่ขับเคลื่อนด้วย AI ของ Microsoft อีกตัวอย่างหนึ่งคือการใช้ Generative AI เพื่อสร้างการแสดงแบบดิจิทัลของระบบ กระบวนการทางธุรกิจ หรือแม้แต่บุคคล เช่น การแสดงแบบไดนามิกของสถานะสุขภาพในปัจจุบันและอนาคตของบุคคลใดบุคคลหนึ่ง
เทคโนโลยีแบบรู้สร้างมีอยู่สามประเภทหลักๆ ได้แก่ Digital Twin, โมเดลภาษาขนาดใหญ่ และการสร้างข้อมูลสังเคราะห์
เทคโนโลยีอื่น ๆ อีกมากมายที่ช่วยสนับสนุนและเสริมศักยภาพให้กับ Generative AI ได้แก่
อัลกอริทึม คือรายการคำสั่งทีละขั้นตอนที่ออกแบบมาเพื่อทำงานเฉพาะหรือแก้ปัญหาใดปัญหาหนึ่ง โปรแกรมคอมพิวเตอร์หลายโปรแกรมเป็นลำดับของอัลกอริทึมที่เขียนในรูปแบบที่คอมพิวเตอร์สามารถเข้าใจได้ เมื่ออัลกอริทึมเริ่มเข้ามาเสริมหรือแทนที่การตัดสินใจของมนุษย์ เราจะต้องสำรวจความเป็นธรรมและเรียกร้องความโปร่งใสในการพัฒนาอัลกอริทึม
ปัญญาประดิษฐ์ ช่วยให้เครื่องสามารถเรียนรู้จากประสบการณ์ ปรับตัวเข้ากับข้อมูลใหม่ และทำงานคล้ายมนุษย์ได้ AI มักอาศัยการเรียนรู้เชิงลึกและ NLP เป็นอย่างมาก ด้วยเทคโนโลยีเหล่านี้ คอมพิวเตอร์สามารถฝึกให้ทำงานเฉพาะได้ด้วยการประมวลผลข้อมูลจำนวนมากและจดจำรูปแบบข้อมูลนั้น
การจัดการข้อมูล มีความสำคัญอย่างยิ่งในการรับรองผลลัพธ์ที่เชื่อถือได้ มีจริยธรรม และปราศจากอคติ โดยเฉพาะในงานที่เกี่ยวข้องกับ AI, การเรียนรู้ของเครื่อง และ LLM ซึ่งได้รับการฝึกฝนจากชุดข้อมูลขนาดใหญ่เพื่อทำความเข้าใจและสร้างเนื้อหาใหม่
การเรียนรู้เชิงลึก เป็นการเรียนรู้ของเครื่องแขนงหนึ่งที่ฝึกให้คอมพิวเตอร์สามารถทำงานคล้ายมนุษย์ได้ เช่น การจดจำเสียงพูด การระบุภาพ และการทำนายผลลัพธ์ นอกจากนี้ยังช่วยเพิ่มความสามารถในการจำแนก รับรู้ ตรวจจับ และอธิบายด้วยข้อมูลได้อีกด้วย โมเดลการเรียนรู้เชิงลึกเช่น GAN และ Variational Autoencoders (VAEs) ได้รับการฝึกฝนด้วยชุดข้อมูลขนาดใหญ่และสามารถสร้างข้อมูลคุณภาพสูงได้ เทคนิคใหม่ๆ เช่น StyleGANs และโมเดลทรานส์ฟอร์เมอร์ช่วยสร้างวิดีโอ รูปภาพ ข้อความ และคำพูดที่สมจริง
การเรียนรู้ของเครื่อง เป็นวิธีการวิเคราะห์ข้อมูลที่สร้างโมเดลเชิงวิเคราะห์โดยอัตโนมัติ ซึ่งเป็นแขนงหนึ่งของปัญญาประดิษฐ์ที่ฝึกเครื่องให้เรียนรู้ การเรียนรู้ของเครื่องมีพื้นฐานมาจากแนวคิดที่ว่าระบบสามารถเรียนรู้จากข้อมูล ระบุรูปแบบ และตัดสินใจโดยมีการแทรกแซงของมนุษย์น้อยที่สุด
การประมวลผลภาษาธรรมชาติ เป็นปัญญาประดิษฐ์แขนงหนึ่งที่ช่วยให้คอมพิวเตอร์เข้าใจ ตีความ และจัดการกับภาษามนุษย์ได้ NLP ดึงความรู้จากหลายสาขาวิชา เช่น วิทยาการคอมพิวเตอร์ และภาษาศาสตร์คอมพิวเตอร์ เพื่อเชื่อมช่องว่างระหว่างการสื่อสารของมนุษย์กับความเข้าใจของคอมพิวเตอร์
เครือข่ายเป็นกลาง เป็นระบบคอมพิวเตอร์ที่มีโหนดเชื่อมต่อกันซึ่งทำงานคล้ายกับเซลล์ประสาทในสมองมนุษย์ เครือข่ายเป็นกลางใช้ขั้นตอนวิธีในการจดจำรูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในข้อมูลดิบ จัดกลุ่มและจำแนกข้อมูล พร้อมทั้งเรียนรู้และพัฒนาอย่างต่อเนื่องเมื่อเวลาผ่านไป
การเรียนรู้แบบเสริมกำลัง คือกระบวนการที่อัลกอริทึมค้นพบผ่านการลองผิดลองถูกว่าการกระทำใดให้รางวัลสูงสุด โมเดลการเรียนรู้ของเครื่องอย่างการเรียนรู้แบบเสริมกำลังนั้นอาศัย สัญญาณรางวัลเป็นกลไกป้อนกลับ เพื่อค่อยๆ เรียนรู้กลยุทธ์หรือเป้าหมายที่ดีที่สุด (หรือให้รางวัลมากที่สุด) โดยมักถูกใช้งานกับหุ่นยนต์ เกม และ การนำทาง
การนำโมเดล Generative AI มาใช้
การดำเนินการโมเดลมีค่าใช้จ่ายสูง เนื่องจากต้องใช้พลังการประมวลผลและข้อมูลจำนวนมหาศาล คุณควรประเมิน ROI อย่างรอบคอบก่อนจะนำโมเดล Generative AI ไปใช้ และพิจารณาความแตกต่างระหว่างโมเดลประเภทต่างๆ เช่น โมเดลรากฐาน และโมเดลโดเมน เรื่องจริยธรรมก็ควรมีการพิจารณาด้วยเช่นกัน ข้อมูลมาจากไหน และใครเป็นเจ้าของ เชื่อถือได้หรือไม่ คุณเข้าใจอย่างถ่องแท้ไหมว่าโมเดลนี้ถูกสร้างขึ้นมาอย่างไร
5 ขั้นตอนการปรับแต่งโมเดล
Generative AI อาศัยอัลกอริธึมและเทคโนโลยี AI ที่แตกต่างกันหลายประเภทเพื่อสร้างข้อมูลที่มีการแจกแจงความน่าจะเป็นและลักษณะคล้ายคลึงกับข้อมูลที่เรียนรู้มา ไม่จำเป็นต้องเริ่มต้นจากศูนย์ แต่คุณสามารถปฏิบัติตามห้าขั้นตอนนี้เพื่อปรับแต่งโมเดลภาษาพื้นฐานขนาดใหญ่ที่ได้รับการฝึกฝนมาแล้วให้เหมาะสม
1. กำหนดงาน
เลือกโมเดลภาษาขนาดใหญ่ที่ได้รับการฝึกฝนไว้ล่วงหน้าที่เหมาะสม แล้วกำหนดงานที่ต้องการใช้โมเดลนั้นในการปรับแต่งให้ชัดเจน ซึ่งอาจเป็นการจัดประเภทข้อความ (เช่น การจดจำเอนทิตี) การสร้างข้อความ เป็นต้น
2.เตรียมข้อมูล
รวบรวมและประมวลผลข้อมูลเฉพาะงานไว้ล่วงหน้า สำหรับงานต่างๆ เช่น การติดฉลาก การจัดรูปแบบ และการสร้างโทเคน สร้างชุดข้อมูลการฝึกและการตรวจสอบความถูกต้อง (และอาจรวมถึงชุดข้อมูลสำหรับการทดสอบด้วย)
3. ปรับแต่งโมเดล
ฝึกโมเดลที่แก้ไขแล้วด้วยข้อมูลเฉพาะงานของคุณ โดยใช้ชุดข้อมูลการฝึกเพื่ออัปเดตน้ำหนักของโมเดล คอยตรวจสอบผลการทำงานของโมเดลบนชุดข้อมูลการตรวจสอบเพื่อป้องกันไม่ให้โมเดลเกิดการเรียนรู้ที่เกินไปจนไม่สามารถนำไปใช้กับข้อมูลใหม่ได้
4. ประเมินและทดสอบ
หลังจากการฝึกฝน ให้ประเมินโมเดลที่ได้รับการปรับแต่งด้วยชุดข้อมูลการตรวจสอบ โดยทำการปรับเปลี่ยนที่จำเป็นตามผลลัพธ์ เมื่อพอใจแล้ว ให้ทดสอบโมเดลบนชุดทดสอบเพื่อให้ได้การประเมินผลที่ไม่มีอคติในการทำงานของโมเดล
5. นำไปใช้งาน
เมื่อคุณมั่นใจในประสิทธิภาพของโมเดลแล้ว ให้ใช้งานตามจุดประสงค์ที่ต้องการ อาจรวมถึงการผสานรวมโมเดลเข้ากับแอปพลิเคชัน AI, เว็บไซต์ หรือแพลตฟอร์มอื่น