การวิเคราะห์ข้อมูลปริมาณมหาศาล
นิยามและความสำคัญ
การวิเคราะห์ข้อมูลปริมาณมหาศาลเป็นการตรวจสอบข้อมูลจำนวนมากเพื่อเปิดเผยรูปแบบ ความสัมพันธ์ และข้อมูลเชิงลึกอื่นๆ ที่ซ่อนอยู่ ด้วยเทคโนโลยีในปัจจุบัน ทำให้สามารถวิเคราะห์ข้อมูลและได้รับคำตอบแทบจะทันที ซึ่งช่วยลดความเร่งรีบและใช้ทรัพยากรน้อยลงร่วมกับเทคโนโลยีการรวบรวมข้อมูล จัดเก็บ วิเคราะห์และเข้าถึงข้อมูลที่คุ้นเคยมากขึ้น
ประวัติและพัฒนาการของการวิเคราะห์ข้อมูลปริมาณมหาศาล
แนวคิดของข้อมูลปริมาณมหาศาลเกิดขึ้นมานานหลายปี ซึ่งองค์กรส่วนมากในเวลานี้มีความเข้าใจว่าหากพวกเขาสามารถรวบรวมข้อมูลทั้งหมดที่หลั่งไหลเข้ามาในธุรกิจของตนได้ พวกเขาจะสามารถนำมาวิเคราะห์และหาประโยชน์จากข้อมูลเหล่านั้นได้ แต่แม้แต่ในช่วงทศวรรษที่ 1950 หลายทศวรรษก่อนที่จะมีการพูดถึงคำว่า "ข้อมูลปริมาณมหาศาล" ธุรกิจมากมายใช้การวิเคราะห์ขั้นพื้นฐาน (อย่างเช่น ตัวเลขที่สำคัญๆ บน spreadsheet ที่เคยได้รับการตรวจสอบด้วยบุคคล) เพื่อเปิดเผยข้อมูลเชิงลึกและแนวโน้มต่างๆ
การวิเคราะห์ข้อมูลปริมาณมหาศาลแสดงให้เห็นประโยชน์ต่างๆ ก็คือ ความรวดเร็วและประสิทธิภาพ ขณะที่หลายปีก่อนหน้านั้น หลายธุรกิจต้องรวบรวมข้อมูล ดำเนินการวิเคราะห์ และค้นหาข้อมูลที่สามารถนำมาใช้ประกอบการตัดสินใจในอนาคตได้ ส่วนในทุกวันนี้ ธุรกิจสามารถระบุข้อมูลเชิงลึกสำหรับการกระทำที่ต้องการการตัดสินใจอย่างทันท่วงที ความสามารถในการทำงานได้เร็วขึ้นและยังคงไว้ซึ่งความคล่องตัว ช่วยให้องค์กรสร้างความได้เปรียบด้านการแข่งขันอย่างที่ไม่เคยมีมาก่อน
ทำไมการวิเคราะห์ข้อมูลปริมาณมหาศาลจึงสำคัญ
การวิเคราะห์ข้อมูลปริมาณมหาศาลช่วยให้องค์กรมากมายสามารถควบคุมข้อมูลของตนและใช้ข้อมูลเหล่านั้นเพื่อค้นพบโอกาสใหม่ๆ ซึ่งนำไปสู่การเคลื่อนไหวขององค์กรอย่างชาญฉลาด การปฏิบัติงานมีประสิทธิภาพมากขึ้น มีผลกำไรสูงขึ้น และทำให้ลูกค้ามีความสุขมากขึ้น จากรายงานของ Tom Davenport ผู้อำนวยการฝ่ายวิจัยของ IIA เรื่อง Big Data in Big Companies ที่ได้เก็บข้อมูลจากมากกว่า 50 ธุรกิจเพื่อทำความเข้าใจในการใช้ข้อมูลปริมาณมหาศาลในบริษัทเหล่านั้น โดยเขาพบว่า บริษัทเหล่านั้นได้ให้ความสำคัญในวิธีการดังต่อไปนี้
- การลดต้นทุน เทคโนโลยีข้อมูลปริมาณมหาศาล อย่างเช่น Hadoop และการวิเคราะห์ข้อมูลในระบบคลาวด์นำมาซึ่งข้อได้เปรียบด้านต้นทุนที่สำคัญเมื่อมีการเก็บข้อมูลเป็นจำนวนมาก รวมถึงยังสามารถช่วยในการค้นพบวิธีในการทำธุรกิจที่มีประสิทธิภาพมากขึ้น
- การตัดสินใจที่รวดเร็วขึ้นและดียิ่งขึ้น ด้วยความเร็วของ Hadoop และระบบการวิเคราะห์จากในหน่วยความจำโดยตรง (In-Memory Analytics) รวมกับความสามารถในการวิเคราะห์แหล่งข้อมูลใหม่ๆ ช่วยให้ธุรกิจสามารถวิเคราะห์ข้อมูลได้ทันที และทำการตัดสินใจจากสิ่งที่ตนเองได้เรียนรู้นั้นได้
- ผลิตภัณฑ์และบริการแบบใหม่ ด้วยความสามารถในการประเมินความต้องการและความพอใจของลูกค้าผ่านการวิเคราะห์ซึ่งทำให้เกิดความสามารถในการส่งมอบในสิ่งที่ลูกค้าต้องการ Devenport ได้ชี้ให้เห็นว่าด้วยการวิเคราะห์ข้อมูลปริมาณมหาศาลนั้น ช่วยให้บริษัทมากมายสามารถสร้างผลิตภัณฑ์ใหม่ๆ ได้ตรงกับความต้องการของลูกค้ามากขึ้น
การวิเคราะห์ข้อมูลปริมาณมหาศาลในปัจจุบัน
องค์กรส่วนใหญ่มีข้อมูลปริมาณมหาศาล และมีองค์กรจำนวนมากที่เข้าใจในความต้องการในการควบคุมและดึงคุณค่าของข้อมูลเหล่านั้นออกมาใช้ แต่ด้วยวิธีใด แหล่งข้อมูลเหล่านี้ครอบคลุมแนวคิดล่าสุดของการแยกและวิเคราะห์ข้อมูลปริมาณมหาศาล
สถิติและการเรียนรู้ของเครื่องโดยละเอียด
แนวคิดของการเรียนรู้ของเครื่องมีขึ้นมาร่วมหลายทศวรรษ และทุกวันนี้ เราสามารถนำมาใช้กับข้อมูลปริมาณมหาศาลได้
มอบพลังของ SAS® สู่ Hadoop
ต้องการประโยชน์จาก Hadoop มากขึ้นใช่ไหม รายงานนี้นำเสนอพอร์ตโฟลิโอของ SAS ที่เกี่ยวกับโซลูชั่นที่ช่วยให้คุณใช้การวิเคราะห์ธุรกิจกับ Hadoop ได้
บริการสุขภาพและการวิเคราะห์ข้อมูลปริมาณมหาศาล
ความนิยมของข้อมูลปริมาณมหาศาลจะเกิดขึ้นในไม่ช้า ดังนั้น การควบคุมข้อมูลสุขภาพทั้งหมดของคุณจึงมีความสำคัญมากกว่าที่เคย การสัมมนาออนไลน์นี้จะเผยให้เห็นถึงบทบาทสำคัญของการวิเคราะห์ข้อมูลปริมาณมหาศาล
การทำงานหนักเบื้องหลังการวิเคราะห์
วิธีการที่จะเข้าใจถึงโอกาสของการวิเคราะห์ธุรกิจนั้น MIT Sloan Management Review ได้ดำเนินการสำรวจประจำปี ครั้งที่ 6 กับผู้บริหาร ผู้จัดการ และผู้เชี่ยวชาญด้านการวิเคราะห์
จุดประสงค์หลักของกลยุทธ์องค์กรที่เป็นทางการสำหรับข้อมูลและการวิเคราะห์ โดยทั่วไปแล้วจะเป็นการปรับปรุงการตัดสินใจด้วยการวิเคราะห์ในขอบเขตที่กว้างของการกระทำ [และ] ผลการสำรวจของเราและการสัมภาษณ์แสดงให้เห็นถึงหลักฐานที่ชัดเจนว่ากลยุทธ์การวิเคราะห์ที่ประสบความสำเร็จจะเปลี่ยนวิธีการตัดสินใจในองค์กรเป็นอย่างมาก
จากรายงานบทสรุป ความทุ่มเทเบื้องหลังความสำเร็จในการวิเคราะห์ของจริง
การวิเคราะห์ขั้นสูงช่วยให้ Rogers Communications เข้าใจความรู้สึกของลูกค้ามากขึ้น
Rogers Communications พยายามอย่างหนักเพื่อเพิ่มความพึงพอใจของลูกค้าและรักษาความเป็นผู้นำในอุตสาหกรรมสื่อและโทรคมนาคมของแคนาดา
เรียนรู้ว่าการวิเคราะห์ขั้นสูงช่วยให้ Rogers Communications ลดการร้องเรียนของลูกค้าได้ถึงครึ่งหนึ่งโดยการนำเสนอบริการที่เหมาะสมให้กับลูกค้าในเวลาที่เหมาะสม
วิธีการทำงานและเทคโนโลยีที่สำคัญ
ไม่มีเทคโนโลยีใดๆ ที่สามารถรวมข้อมูลปริมาณมหาศาลได้เพียงเทคโนโลยีเดียว และแน่นอนว่ามีการวิเคราะห์ขั้นสูงที่สามารถนำไปใช้กับข้อมูลปริมาณมหาศาลนี้ได้ แต่ในความเป็นจริงแล้วเทคโนโลยีหลายประเภททำงานร่วมกันเพื่อช่วยให้คุณได้รับประโยชน์สูงสุดจากข้อมูลของคุณ และนี่คือเทคโนโลยีหลักเหล่านั้น
การเรียนรู้ของเครื่อง การเรียนรู้ของเครื่อง คือเซตย่อยเฉพาะของ AI ที่ฝึกฝนเครื่องจักรให้เรียนรู้ สิ่งเหล่านี้เป็นปัจจัยที่ทำให้การสร้างและใช้งานแบบจำลองเป็นไปได้ด้วยความรวดเร็วอย่างอัตโนมัติ เพื่อการทำงานวิเคราะห์แบบจำลองสำหรับข้อมูลที่มีปริมาณมหาศาลและมีความซับซ้อนสูงขึ้น ด้วยผลการทำงานที่แม่นยำและรวดเร็วแม้ต้องรับมือกับงานขนาดใหญ่ก็ตาม และองค์กรต่างๆ จะได้รับประโยชน์จากการพัฒนาและใช้งานแบบจำลองที่มีความแม่นยำ โดยเพิ่มโอกาสการค้นพบช่องทางสร้างกำไรอันงดงามทางธุรกิจ และป้องกันความเสี่ยงที่ซ่อนอยู่
การบริหารจัดการข้อมูล ข้อมูลจะต้องมีคุณภาพสูงและได้รับการควบคุมเป็นอย่างดีก่อนที่จะนำมาวิเคราะห์ได้อย่างน่าเชื่อถือ ข้อมูลที่เคลื่อนไหวเข้าออกจากองค์กรอย่างต่อเนื่องนั้นเป็นสิ่งสำคัญในการสร้างกระบวนการที่ทำซ้ำได้ ทั้งนี้เพื่อสร้างและรักษามาตรฐานของคุณภาพข้อมูล เมื่อใดก็ตามที่ข้อมูลมีความน่าเชื่อถือ องค์กรควรสร้างโปรแกรมบริหารจัดการข้อมูลหลักที่สามารถจัดการองค์กรทั้งหมดได้ในทิศทางเดียวกัน
การวิเคราะห์เหมืองข้อมูล การวิเคราะห์เหมืองข้อมูลช่วยให้คุณตรวจสอบข้อมูลปริมาณมากเพื่อค้นพบรูปแบบในข้อมูล และคุณสามารถใช้ข้อมูลนี้ในการวิเคราะห์เพิ่มเติมเพื่อช่วยตอบคำถามทางธุรกิจอันซับซ้อน ด้วยซอฟต์แวร์การวิเคราะห์เหมืองข้อมูล คุณสามารถค้นหาข้อมูลรบกวนที่ซ้ำและไม่เป็นระเบียบ หาสิ่งที่เกี่ยวข้องอย่างตรงจุด และใช้ข้อมูลนั้นในการประเมินผลลัพธ์ที่มีโอกาสเกิดขึ้น จากนั้นเร่งตัดสินใจโดยอาศัยข้อมูลที่ครบถ้วนให้เร็วขึ้น
Hadoop โครงร่างซอฟต์แวร์เสรี (โอเพนซอร์ส) นี้สามารถเก็บข้อมูลได้เป็นจำนวนมากและยังสามารถเรียกใช้งานแอปพลิเคชันบนคลัสเตอร์ของฮาร์ดแวร์ตามท้องตลาด ซึ่งมันได้กลายเป็นเทคโนโลยีสำคัญในการทำธุรกิจเนื่องจากการเพิ่มขึ้นอย่างต่อเนื่องของปริมาณและความหลากหลายของข้อมูล อีกทั้งมีความรวดเร็วในการประมวลผลข้อมูลขนาดใหญ่โดยรูปแบบการประมวลผลแบบกระจาย อีกหนึ่งผลประโยชน์เพิ่มเติมคือโครงร่างโอเพนซอร์สของ Hadoop นั้นเปิดให้ใช้งานฟรีและใช้ฮาร์ดแวร์ตามท้องตลาดเป็นตัวเก็บข้อมูลจำนวนมาก
การวิเคราะห์ข้อมูลแบบในหน่วยความจำ ด้วยการวิเคราะห์ข้อมูลจากหน่วยความจำระบบ (แทนที่จะมาจากฮาร์ดดิสก์ไดรฟ์) คุณสามารถรับข้อมูลเชิงลึกได้ทันทีจากข้อมูลของคุณและจัดการกับข้อมูลเหล่านั้นอย่างรวดเร็ว เทคโนโลยีนี้สามารถลบการจัดเตรียมข้อมูลและระยะเวลาประมวลผลการวิเคราะห์เพื่อทดสอบโครงการใหม่และสร้างแบบจำลอง สิ่งนี้ไม่เพียงแต่เป็นวิธีที่ง่ายสำหรับองค์กรในการอยู่อย่างคล่องตัวและทำการตัดสินใจทางธุรกิจได้ดีขึ้น แต่ยังช่วยให้พวกเขาสามารถใช้งานโครงการการวิเคราะห์แบบวนซ้ำและแบบโต้ตอบได้อีกด้วย
การวิเคราะห์เชิงคาดการณ์ การวิเคราะห์เชิงคาดการณ์ใช้ข้อมูล อัลกอริธึมเชิงสถิติ และเทคนิคการเรียนรู้โดยเครื่องจักรเพื่อบ่งชี้ถึงความเป็นไปได้ของผลลัพธ์ในอนาคตโดยอิงจากข้อมูลย้อนหลัง ทั้งหมดที่กล่าวมานั้นล้วนเกี่ยวกับการประเมินที่ดีที่สุดในการประเมินสิ่งที่จะเกิดขึ้นในอนาคต ดังนั้นองค์กรจึงมีความมั่นใจได้มากขึ้นว่าพวกเขากำลังทำการตัดสินใจทางธุรกิจได้ดีที่สุด แอปพลิเคชันส่วนใหญ่ที่ใช้กันทั่วไปในการวิเคราะห์เชิงคาดการณ์ ได้แก่ การตรวจจับการทุจริต ความเสี่ยง การดำเนินงานและการตลาด
การวิเคราะห์เหมืองข้อความ ด้วยเทคโนโลยีการทำเหมืองข้อความ คุณสามารถวิเคราะห์ข้อมูลตัวอักษรจากเว็บ เขตข้อมูลข้อคิดเห็น หนังสือ และแหล่งข้อมูลรูปแบบตัวอักษรอื่นๆ เพื่อเผยให้เห็นข้อมูลที่คุณไม่เคยสังเกตมาก่อน การวิเคราะห์เหมืองข้อความใช้การเรียนรู้ของเครื่อง หรือเทคโนโลยีการประมวลผลภาษาธรรมชาติเพื่อค้นหาเอกสาร เช่น อีเมล บล็อก หน้าฟีด Twitter การสำรวจข้อมูล ข้อมูลทางการแข่งขัน และอื่นๆ ที่ช่วยให้คุณวิเคราะห์ข้อมูลจำนวนมากและค้นพบหัวข้อใหม่ๆ และความสัมพันธ์ในระยะหนึ่ง
ความก้าวหน้าในอนาคต
มาดูกันว่าการวิเคราะห์ข้อมูลปริมาณมหาศาลมีบทบาทอย่างไรในการจัดการข้อมูล
SAS® Platform
ระบบ SAS® Platform ของเราสร้างขึ้นจากกลยุทธ์ในการใช้ข้อมูลวิเคราะห์เชิงลึกเพื่อขับเคลื่อนการดำเนินการทางธุรกิจ แพลตฟอร์มของเราจึงพร้อมรองรับทุกขั้นตอนการทำงานด้านการวิเคราะห์ของคุณ ตั้งแต่ข้อมูลสู่การค้นพบไปจนถึงการปรับใช้
Visual Text Analytics
SAS Visual Text Analytics ช่วยให้คุณสามารถตรวจหาแนวโน้มที่เกิดขึ้นใหม่และโอกาสที่ซ่อนเร้น เพราะการวิเคราะห์นี้ทำให้คุณแปลงข้อมูลที่ไม่มีโครงสร้างชัดเจนเป็นข้อมูลเชิงลึกที่มีความหมายได้โดยอัตโนมัติ ซึ่งเป็นตัวป้อนการเรียนรู้ของเครื่องและแบบจำลองเชิงคาดการณ์
Recommended reading
- หน้าข้อมูลเชิงลึก Break stuff . . . servers, rules and the glass ceilingCarla Gentry knows what it’s like to be the only woman on the team and is happy to share her hard-won knowledge with an ever-growing number of female data scientists. She recently shared with us some sage advice for women entering or interested in advancing in the field.
- บทความ As AI accelerates, focus on 'road' conditionsAI technology has made huge strides in a short amount of time and is ready for broader adoption. But as organizations accelerate their AI efforts, they need to take extra care, because as any police officer will tell you, even small potholes can cause problems for vehicles traveling at high speeds.
- บทความ The untapped potential in unstructured textText is the largest human-generated data source. It grows every day as we post on social media, interact with chatbots and digital assistants, send emails, conduct business online, generate reports and essentially document our daily thoughts and activities using computers and mobile devices.
ตั้งแต่ปี 1976 บริษัทต่างๆ ทั่วโลกไว้วางใจใน SAS