รายการคุณสมบัติของ SAS Visual Statistics

การสำรวจและค้นพบข้อมูลผ่านการแสดงภาพ (ใช้งานผ่าน SAS Visual Analytics)

การสำรวจและค้นพบข้อมูลผ่านการแสดงภาพ (ใช้งานผ่าน SAS Visual Analytics)

  • ช่วยให้คุณสามารถตีความตัวแปรและความสัมพันธ์ที่ซับซ้อนต่างๆ ในชุดฐานข้อมูลขนาดใหญ่ ซึ่งส่งผลต่อผลลัพธ์การพยากรณ์จากแบบจำลอง
  • คุณสามารถทำการคัดกรองรายการข้อมูลต่างๆ และเข้าใจระดับอิทธิพลของตัวแปรต่างๆ ที่ส่งผลต่อแบบจำลองของคุณได้อย่างง่ายดายยิ่งขึ้น
  • ทำการตรวจจับข้อมูลที่มีค่าผิดปกติ รวมถึงข้อมูลที่ส่งผลต่อความแม่นยำของการพยากรณ์ เพื่อให้คุณทำการตัดสินใจและขจัดข้อมูลที่ผิดปกติออกจากการวิเคราะห์ของคุณ เช่น ในการใช้งานแบบจำลอง
  • คุณยังสามารถสำรวจชุดข้อมูลที่มีได้ด้วยแผนภาพและแผนภูมิต่างๆ ไม่ว่าจะเป็น แผนภูมิแท่ง (bar charts), ฮิสโทแกรม (histograms), แผนภาพกล่อง (box plots), ฮีทแม็พ (heat maps), แผนภาพบับเบิ้ล (bubble plots), แผนที่ภูมิศาสตร์ (geographic maps) และรูปแบบอื่นๆ อีกมากมาย
  • ให้คุณคำนวณผลลัพธ์เพื่อการพยากรณ์ต่าง ๆ ที่สามารถนำไปใช้งานได้ในแบบจำลองหรือการแสดงผลเชิงภาพได้โดยตรง ผลลัพธ์ที่คุณได้นั้น ยังสามารถบันทึกและส่งต่อไปยังฝ่ายงานหรือหน่วยธุรกิจอื่น ๆ ที่มิได้ทำงานกับแบบจำลองโดยตรง หรือไม่มีขีดความสามารถด้านแบบจำลองได้อีกด้วย
  • แปลงตัวแปรค่าตัวเลขทางธุรกิจที่มีสองระดับเป็นตัวแปรหมวดหมู่โดยอัตโนมัติเมื่อเปิดชุดข้อมูลเป็นครั้งแรก

ให้คุณเข้าถึงเทคนิคการวิเคราะห์ต่างๆ ได้ด้วยระบบอินเตอร์เฟสเชิงภาพ

ให้คุณเข้าถึงเทคนิคการวิเคราะห์ต่างๆ ได้ด้วยระบบอินเตอร์เฟสเชิงภาพ

  • การจัดกลุ่ม (Clustering):
    • คุณสามารถใช้งานฟังก์ชั่น k-means, k-modes หรือ k-prototypes clustering ได้
    • สามารถทำการเปรียบเทียบแผนภาพคอร์ดิเนต (coordinate plots) เพื่อให้คุณทำการประเมินข้อมูลภายในคลัสเตอร์ต่างๆ อย่างมีประสิทธิภาพ
    • สร้างแผนภาพการกระจาย (scatter plots) สำหรับชุดข้อมูลขนาดเล็ก และ heat maps สำหรับชุดข้อมูลขนาดใหญ่ พร้อมฟังก์ชั่น cluster profiles สำหรับแผนภาพทั้งสองแบบ
    • แสดงผลของค่าสถิติเชิงพรรณนาโดยละเอียดไม่ว่าจะเป็นค่าเฉลี่ย หรือจำนวนข้อมูล (number of observations) ในแต่ละคลัสเตอร์ เป็นต้น
    • ให้คุณสามารถสร้าง cluster ID ได้ทันทีที่ต้องการ โดยแสดงผลในคอลัมน์ชุดใหม่
    • รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
  • แผนผังการตัดสินใจแบบต้นไม้ (decision trees):
    • นอกจากนี้ ยังรองรับฟังก์ชั่นสำหรับสร้างแผนผังตัดสินใจแบบต้นไม้จัดกลุ่ม (classification trees) และแผนผังตัดสินใจแบบต้นไม้สำหรับทำนายค่า (regression trees)
    • บนพื้นฐานของอัลกอริทึมแบบ modified C4.5 หรือ cost-complexity pruning
    • ให้คุณสามารถจัดทำและย่อยแผนผังต้นไม้ลงได้อย่างสะดวกง่ายดาย สร้างต้นไม้ย่อย (subtree) ขึ้นอย่างง่ายดาย
    • คุณสามารถกำหนดความละเอียดของแผนผังต้นไม้ รวมถึงจำนวนกิ่งของการวิเคราะห์สูงสุด ขนาดของ node ย่อย (leafs) รวมถึงระดับการยุบรวมแผนผัง (pruning) และอื่นๆ อีกมากมาย
    • ใช้ฟังก์ชั่นการแสดงผลสำหรับแผนผังต้นไม้เพื่อให้คุณสามารถเจาะลึกและพิจารณาส่วนต่างๆ ของแผนผังต้นไม้ได้อย่างคล่องแคล่ว
    • ให้คุณสามารถสร้าง leaf ID, ค่าประมาณการต่าง ๆ และค่า residuals ได้ทันทีที่ต้องการ โดยแสดงผลในคอลัมน์ชุดใหม่
    • รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
    • รองรับการกำจัดออกด้วยข้อมูลที่ถูกเลือก
    • รองรับการจูนอัตโนมัติด้วยตัวเลือกสำหรับขนาดของโหนดปลายสุด
    • เปิดใช้งานการแก้ไขจุดแยกด้วยตนเองสำหรับแผนผังแบบอินเทอร์แอคทีฟ
  • สมการถดถอยเชิงเส้น (linear regression):
    • ค่า influence statistics
    • รองรับการเลือกตัวแปรทั้งแบบ forward, backward, stepwise และแบบ lasso selection ตามความต้องการของคุณ
    • กราฟการเกิดซ้ำสำหรับการเลือกตัวแปร
    • ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
    • การวิเคราะห์ค่า residual (residual diagnostics)
    • ตารางสรุปผลสามารถรวบรวมผลลัพธ์ต่าง ๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็น overall ANOVA, ค่าสถิติเกี่ยวกับมิติของแบบจำลอง, ค่าสถิติ fit statistics, model ANOVA, Type III test และการประมาณค่าพารามิเตอร์ต่างๆ
    • ให้คุณสามารถทำการคำนวณค่าประมาณและค่า residuals ต่างๆ ได้ทันทีที่ต้องการ โดยแสดงผลในคอลัมน์ชุดใหม่
    • รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
  • แบบจำลองถดถอยแบบ logistic regression:
    • แบบจำลองสำหรับข้อมูลประเภท binary data ซึ่งมาพร้อมกับฟังก์ชั่นแบบจำลองแบบ logit และ probit
    • ค่า influence statistics
    • รองรับการเลือกตัวแปรทั้งแบบ forward, backward, stepwise และแบบ lasso selection ตามความต้องการของคุณ
    • กราฟการเกิดซ้ำสำหรับการเลือกตัวแปร
    • ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
    • การวิเคราะห์ค่า residual (residual diagnostics)
    • ตารางสรุปผลสามารถรวบรวมค่าสถิติต่างๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็น มิติของแบบจำลอง ประวัติการทำงานซ้ำ (iteration history) สถานะ convergence status, Type III test การประมาณค่าตัวแปร และ response profile
    • ให้คุณสามารถทำการคำนวณค่าประมาณสำหรับหมวดหมู่ และค่าประมาณสำหรับความน่าจะเป็นของเหตุการณ์ต่าง ๆ โดยแสดงผลในคอลัมน์ชุดใหม่ ให้คุณสามารถปรับแต่งค่า prediction cutoff เพื่อกำหนดกลุ่มให้กับข้อมูลแต่ละรายการว่าอยู่ในประเภท event หรือ non-event
    • รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
  • แบบจำลองแบบ generalized linear model:
    • รองรับรูปแบบการแจกแจงข้อมูลหลากหลายรูปแบบไม่ว่าจะเป็น beta, normal, binary, exponential, gamma, geometric, Poisson, Tweedie, inverse Gaussian และ negative binomial
    • รองรับการเลือกตัวแปรทั้งแบบ forward, backward, stepwise และแบบ lasso selection ตามความต้องการของคุณ
    • รองรับตัวแปรออฟเซ็ต (Offset variable support)
    • ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
    • การวิเคราะห์ค่า residual (residual diagnostics)
    • ตารางสรุปผลสามารถรวบรวมค่าสถิติต่าง ๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็นข้อมูลภาพรวมของแบบจำลอง ประวัติการทำงานซ้ำ (iteration history) ค่า fit statistics ตารางสำหรับ Type III test และการประมาณค่าตัวแปร
    • มีตัวเลือกการจัดการข้อมูลที่ตกหล่นหรือขาดหายไปเพื่อช่วยให้คุณจัดการกับข้อมูลที่ตกหล่นไปในส่วนของตัวแปร predictor variable ได้
    • ให้คุณสามารถทำการคำนวณค่าประมาณและค่า residuals ต่างๆ ได้ทันทีที่ต้องการ โดยแสดงผลในคอลัมน์ชุดใหม่
    • รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
  • แบบจำลองแบบ Generalized additive model:
    • รองรับรูปแบบการแจกแจงข้อมูลหลากหลายรูปแบบไม่ว่าจะเป็น normal, binary, gamma, Poisson, Tweedie, inverse Gaussian และ negative binomial
    • รองรับการทำงานกับ spline effects ทั้งแบบหนึ่งมิติและสองมิติ
    • วิธีการวิเคราะห์แบบ GCV GACV และ UBRE สำหรับเลือก smoothing effects ที่เหมาะสม
    • รองรับตัวแปรออฟเซ็ต (Offset variable support)
    • ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
    • การวิเคราะห์ค่า residual (residual diagnostics)
    • ตารางสรุปผลสามารถรวบรวมค่าสถิติต่าง ๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็น ข้อมูลภาพรวมของแบบจำลอง ประวัติการทำงานซ้ำ (iteration history) ค่า fit statistics และการประมาณค่าตัวแปร
    • รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
  • แบบจำลองถดถอยแบบ nonparametric logistic regression:
    • มีแบบจำลองสำหรับข้อมูลประเภท binary data หลายรูปแบบ ทั้ง logit, probit, log-log และ c-log-log-link
    • รองรับการทำงานกับ spline effects ทั้งแบบหนึ่งมิติและสองมิติ
    • วิธีการวิเคราะห์แบบ GCV GACV และ UBRE สำหรับเลือก smoothing effects ที่เหมาะสม
    • รองรับตัวแปรออฟเซ็ต (Offset variable support)
    • ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
    • การวิเคราะห์ค่า residual (residual diagnostics)
    • ตารางสรุปผลสามารถรวบรวมค่าสถิติต่าง ๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็น ข้อมูลภาพรวมของแบบจำลอง ประวัติการทำงานซ้ำ (iteration history) ค่า fit statistics และการประมาณค่าตัวแปร
    • รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ

ช่วยให้คุณสามารถใช้งานเทคนิคการวิเคราะห์ต่าง ๆ ผ่านฟังก์ชั่นด้านการเขียนโปรแกรม

การเขียนโปรแกรมเข้าถึงเทคนิคการวิเคราะห์

  • โปรแกรมเมอร์และผู้เชี่ยวชาญหรือ data scientists ของคุณ สามารถเข้าใช้งาน SAS Viya (เซิร์ฟเวอร์ CAS) ได้จาก SAS Studio ด้วยระบบการทำงานของ SAS เช่น PROCs และชุดคำสั่งการทำงานอื่นๆ
  • โปรแกรมเมอร์ของคุณสามารถใช้ชุดคำสั่ง CAS ต่าง ๆ ได้ด้วยคำสั่งของ PROC CAS หรือแม้แต่ทำงานผ่านระบบภาษาอื่น ๆ ไม่ว่าจะเป็น Python, R, Lua และ Java
  • ผู้ใช้งานสามารถใช้ระบบ SAS Viya (บน เซิร์ฟเวอร์ CAS) จากแอปพลิเคชั่นของตนเองได้ ผ่าน REST API สาธารณะ
  • พร้อมผสานการทำงานกับ Python Pandas DataFrames ได้ทันที โปรแกรมเมอร์ผู้เชี่ยวชาญการใช้ภาษา Python ของคุณ สามารถทำการอัปโหลด DataFrames ไปยัง CAS และสามารถดึงผลลัพธ์ต่าง ๆ ใน CAS ไปยัง DataFrames ได้อย่างสะดวกยิ่งขึ้น และยังสามารถทำงานร่วมกับโปรแกรมภาษา Python อื่นๆ เช่น Pandas, matplotlib, Plotly และ Bokeh เป็นต้น
  • รวมซอฟต์แวร์ SAS/STAT® และ SAS/GRAPH®
  • การวิเคราะห์แบบ principal component analysis (PCA):
    • สามารถทำการลดมิติของชุดข้อมูล (dimension reduction) ได้ โดยการคำนวณข้อมูลส่วนประกอบที่สำคัญ
    • ให้คุณสามารถใช้งานอัลกอริทึมและคำสั่งต่าง ๆ ไม่ว่าจะเป็น eigenvalue decomposition และอัลกอริทึม NIPALS และ ITERGS
    • แสดงผลลัพธ์ค่าคะแนนแบบ principal component score สำหรับรายการข้อมูลต่างๆ
    • สร้าง scree plots และ pattern profile plots
  • แผนผังการตัดสินใจแบบต้นไม้ (decision trees):
    • รองรับการใช้งานสำหรับ classification trees และ regression trees
    • รองรับฟังก์ชั่นการทำงานทั้งในรูปแบบของหมวดหมู่และตัวเลข
    • ช่วยคุณใช้งานเกณฑ์ (criteria) ต่าง ๆ สำหรับการแยก node ออกจากกัน โดยอ้างอิงกับการวัด impurity ของข้อมูล และการทดสอบทางสถิติ
    • พร้อมมอบฟังก์ชั่นการตัดแต่งหรือย่อยแผนผังต้นไม้ในรูปแบบ cost-complexity method และ reduced error method ให้กับคุณ
    • รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
    • รองรับการใช้ validation data เพื่อเลือกใช้งานชุด subtree ที่ดีที่สุดสำหรับคุณ
    • รองรับการใช้ test data เพื่อการประเมินคุณภาพของแบบจำลอง tree model ในขั้นท้ายสุด
    • สนับสนุนคุณด้วยเครื่องมือการจัดการกับค่าข้อมูลที่หายไป ซึ่งมีหลากหลายวิธี เช่น surrogate rules เป็นต้น
    • สร้างแผนผังแบบต้นไม้หรือ tree diagram
    • แสดงค่าสถิติสำหรับประเมินแบบจำลอง รวมถึงสถิติที่ละเอียดประเภท resubstitution statistics อีกด้วย
    • ทำการคำนวณเกณฑ์ชี้วัดความสำคัญของตัวแปรต่างๆ
    • แสดงผลของ leaf assignments และค่าการพยากรณ์สำหรับข้อมูลของคุณ
  • การจัดกลุ่ม (Clustering):
    • มาพร้อมกับอัลกอริทึมแบบ k-means algorithm เพื่อทำการจัดคลัสเตอร์สำหรับตัวแปรที่มีลักษณะเป็นค่าต่อเนื่อง (continuous/interval variables)
    • สามารถใช้งานอัลกอริทึมแบบ k-modes เพื่อทำการจัดคลัสเตอร์ตัวแปรที่เป็นค่าตัวเลข
    • สามารถใช้งานการวัดระยะห่างแบบต่าง ๆ เพื่อพิจารณาความคล้ายคลึงของข้อมูลตำแหน่งต่าง ๆ
    • สามารถใช้งานเทคนิค aligned box criterion method เพื่อการประมาณการจำนวนของคลัสเตอร์
    • แสดงผลการรวมกลุ่มของคลัสเตอร์ข้อมูลและการวัดระยะห่างของรายการข้อมูลต่าง ๆ
  • สมการถดถอยเชิงเส้น (linear regression):
    • รองรับการทำงานกับแบบจำลองเชิงเส้น และตัวแปรประเภท continuous variables และ classification variables
    • รองรับการทำงานกับพารามิเตอร์ต่าง ๆ หลากหลายรูปแบบ เพื่อการวิเคราะห์ classification effects
    • รองรับการทำงานกับ interaction effects และ nested effects ทุกรูปแบบ
    • รองรับการทำงานกับ polynomial effects และ spline effects
    • รองรับการเลือกตัวแปรทั้งแบบ forward, backward, stepwise, least angle regression และแบบ lasso selection ตามความต้องการของคุณ
    • รองรับการใช้งาน information criteria และเครื่องมือในการทำ validation สำหรับข้อมูลหลากหลายประเภท เพื่อช่วยในการคัดเลือกแบบจำลองที่เหมาะสำหรับคุณที่สุด
    • ให้คุณสามารถเลือกระดับการทำ classification effects ในระดับต่างๆ ตามที่คุณต้องการ
    • รักษาลำดับชั้นของผลกระทบต่างๆ ของแบบจำลองเอาไว้
    • รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
    • มาพร้อมกับค่าสถิติต่าง ๆ ที่หลากหลายสำหรับการวิเคราะห์และประเมินผล
    • สร้าง SAS code สำหรับการให้คะแนนรูปแบบ production scoring
  • แบบจำลองถดถอยแบบ logistic regression:
    • รองรับ binary responses และ binomial responses
    • รองรับการทำงานกับพารามิเตอร์ต่าง ๆ หลากหลายรูปแบบ เพื่อการวิเคราะห์ classification effects
    • รองรับการทำงานกับ interaction effects และ nested effects ทุกรูปแบบ
    • รองรับการทำงานกับ polynomial effects และ spline effects
    • รองรับการเลือกตัวแปรทั้งแบบ forward, backward, fast backward และแบบ lasso selection ตามความต้องการของคุณ
    • รองรับการใช้งาน information criteria และเครื่องมือในการทำ validation สำหรับข้อมูลหลากหลายประเภท เพื่อช่วยในการคัดเลือกแบบจำลองที่เหมาะสำหรับคุณที่สุด
    • ให้คุณสามารถเลือกระดับการทำ classification effects ในระดับต่างๆ ตามที่คุณต้องการ
    • รักษาลำดับชั้นของผลกระทบต่างๆ ของแบบจำลองเอาไว้
    • รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
    • ให้ผลค่าสถิติต่าง ๆ มากหลายประเภท เพื่อประโยชน์ในการประเมินผลของแบบจำลองของคุณ
    • มีฟังก์ชั่นการปรับตั้งค่าที่เหมาะสมที่หลากหลายสำหรับแบบจำลองแบบ maximum likelihood
  • แบบจำลองแบบ generalized linear model:
    • รองรับการทำงานร่วมกับลักษณะการแจกแจงข้อมูลที่หลากหลาย เช่นรูปแบบ binary, normal, Poisson และ gamma
    • รองรับการทำงานกับพารามิเตอร์ต่าง ๆ หลากหลายรูปแบบ เพื่อการวิเคราะห์ classification effects
    • รองรับการทำงานกับ interaction effects และ nested effects ทุกรูปแบบ
    • รองรับการทำงานกับ polynomial effects และ spline effects
    • รองรับการเลือกตัวแปรทั้งแบบ forward, backward, fast backward, stepwise และแบบ group lasso selection ตามความต้องการของคุณ
    • รองรับการใช้งาน information criteria และเครื่องมือในการทำ validation สำหรับข้อมูลหลากหลายประเภท เพื่อช่วยในการคัดเลือกแบบจำลองที่เหมาะสำหรับคุณที่สุด
    • ให้คุณสามารถเลือกระดับการทำ classification effects ในระดับต่างๆ ตามที่คุณต้องการ
    • รักษาลำดับชั้นของผลกระทบต่างๆ ของแบบจำลองเอาไว้
    • รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
    • ให้ผลค่าสถิติต่าง ๆ มากหลายประเภท เพื่อประโยชน์ในการประเมินผลของแบบจำลองของคุณ
    • มีฟังก์ชั่นการปรับตั้งค่าที่เหมาะสมที่หลากหลายสำหรับแบบจำลองแบบ maximum likelihood
  • แบบจำลองถดถอยแบบ nonlinear regression:
    • มาพร้อมกับฟังก์ชั่นสำหรับแบบจำลองทั้งแบบ standard distribution และ general distribution
    • ระบบจะทำการคำนวณค่าพารามิเตอร์จากคำสั่งที่คุณกำหนดเอง เพื่อให้ได้ผลการประมาณค่าที่มีความแม่นยำสูง
    • และประมวลผลคำสั่งที่คุณป้อนเข้าสู่ระบบด้วยชุดคำสั่ง ESTIMATE และ PREDICT
    • จำเป็นต้องมีชุดข้อมูลที่มี CMP item store หากมิได้ใช้งานชุดคำสั่ง PROC NLMOD
    • ทำการประมาณค่าพารามิเตอร์ต่าง ๆ ด้วยวิธี least squares
    • ทำการประมาณค่าพารามิเตอร์ต่าง ๆ ด้วยวิธี maximum likelihood
  • แบบจำลองถดถอยแบบ quantile regression:
    • รองรับฟังก์ชั่นการทำงานสมการถดถอยแบบ quantile regression สำหรับระดับควอนไทล์ทั้งแบบ single quantile level และ multiple quantile levels
    • รองรับการทำงานร่วมกับพารามิเตอร์ที่หลากหลาย (multiple parameterizations) เพื่อการจัดหมวดหมู่ของตัวแปร
    • รองรับการทำงานกับ interaction effects (แบบ crossed effects) และ nested effects ทุกรูปแบบ
    • รองรับการใช้งานเพื่อการคัดเลือกหรือคัดกรองแบบจำลองในรูปของ hierarchical model selection strategy จากค่าผลกระทบ (effects) ต่าง ๆ ได้
    • ให้คุณสามารถเลือกใช้งานฟังก์ชั่น effect-selection methods ที่หลากหลายได้
    • ให้คุณสามารถใช้งานฟังก์ชั่น effect selection ได้โดยผ่านเกณฑ์การเลือกที่หลากหลายตามความต้องการ
    • รองรับการทำงานของ stopping rules และ selection rules
  • แบบจำลองแบบ predictive partial least squares model:
    • มีภาษา syntax สำหรับเขียนโปรแกรมที่รองรับตัวแปรเพื่อการจัดหมวดหมู่ต่าง ๆ ตัวแปรที่เป็นค่าต่อเนื่อง และการตอบสนองระหว่างตัวแปรต่าง ๆ รวมถึง nestings
    • มีชุดคำสั่งในรูปแบบ effect-construction syntax เพื่อการใช้งานสำหรับ polynomial effects และ spline effects
    • รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles และ testing roles
    • ให้คุณสามารถทำการทดสอบแบบ set validation ได้ เพื่อให้คุณสามารถเลือกจำนวนของตัวแปรประเภท extracted factors
    • สามารถใช้งานเทคนิคการวิเคราะห์ทางสถิติต่าง ๆ ได้ไม่ว่าจะเป็น principal component regression, reduced rank regression และ partial least squares regression
  • แบบจำลองแบบ Generalized additive model:
    • ทำการปรับแต่งแบบจำลองแบบ generalized additive models โดยอาศัย low-rank regression spline ต่าง ๆ ที่มีอยู่
    • ทำการประมาณค่าพารามิเตอร์สำหรับสมการถดถอย ด้วยวิธี penalized likelihood estimation
    • ทำการประมาณค่าพารามิเตอร์แบบ smoothing parameters โดยสามารถใช้งานได้ทั้งวิธี performance iteration method หรือ outer iteration method
    • ทำการประมาณค่าพารามิเตอร์ของสมการถดถอยด้วยวิธี maximum likelihood
    • สามารถทดสอบผลของ spline term ต่าง ๆ ได้ ผ่านการใช้ Wald statistic
    • มาพร้อมกับภาษา syntax เพื่อการสร้างแบบจำลองซึ่งสามารถรองรับตัวแปรเพื่อการจัดหมวดหมู่ต่างๆ ตัวแปรที่เป็นค่าต่อเนื่อง และการตอบสนองระหว่างตัวแปรต่าง ๆ รวมถึง nestings
    • คุณจะสามารถสร้าง spline term ขึ้นมาด้วยตัวแปรที่หลากหลาย
  • แบบจำลองถดถอยแบบ proportional hazard regression:
    • ให้คุณทำการปรับตั้งค่าสำหรับแบบจำลองถดถอยแบบ Cox proportional hazards regression เพื่อให้สามารถรองรับข้อมูลแบบ survival data และให้คุณทำการเลือกตัวแปรต่าง ๆ ได้ตามที่ต้องการ
    • พร้อมการทำงานจากภาษา Syntax เพื่อการสร้างแบบจำลองด้วยตัวแปรเพื่อการจัดหมวดหมู่ต่างๆ ตัวแปรที่เป็นค่าต่อเนื่อง และการตอบสนองระหว่างตัวแปรต่าง ๆ รวมถึง nestings
    • มีชุดคำสั่งในรูปแบบ effect-construction syntax เพื่อการใช้งานสำหรับ polynomial effects และ spline effects
    • ให้คุณสามารถใช้งานการประมาณค่าแบบ maximum partial likelihood estimation รวมทั้งทำการวิเคราะห์แบบ stratified analysis และทำการเลือกตัวแปรได้
    • รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
    • รองรับการวิเคราะห์แบบ weighted analysis และแบบ grouped analysis
  • การควบคุมกระบวนการทางสถิติ (statistical process control):
    • สามารถใช้งาน Shewhart control chart analysis ได้
    • ทำการวิเคราะห์ตัวแปรประเภท process variables ต่าง ๆ เพื่อตรวจจับขั้นตอนใดๆ ที่อาจก่อปัญหาทางสถิติขึ้น
    • ทำการปรับแต่งขอบเขตของข้อมูลหรือ control limits ในกรณีที่ชุดข้อมูลย่อยต่าง ๆ มีขนาดแตกต่างกัน
    • สามารถทำการประมาณค่า control limits จากชุดข้อมูลได้ รวมถึงคำนวณค่า control limits จากค่าเฉพาะเจาะจงเพื่อการหาค่าพารามิเตอร์ของกลุ่มประชากร (ในรูปแบบ known standards) รวมไปถึงการอ่านค่าขอบเขตจากชุดข้อมูลที่มีอยู่
    • สามารถทำการทดสอบ (tests) ต่างๆ สำหรับกรณีการวิเคราะห์พิเศษต่าง ๆ (เช่น การทดสอบตามแนวทาง Western Electric Rules)
    • ทำการประมาณค่าส่วนเบี่ยงเบนมาตรฐานในขั้นตอนการทำงานต่างๆ ด้วยหลากหลายวิธี (ใช้ได้สำหรับการทำงานแผนภาพ variable charts เท่านั้น)
    • ให้คุณเซฟสถิติเกี่ยวกับแผนภาพต่าง ๆ และควบคุมขอบเขตของค่าต่างๆ ในตารางแสดงผลข้อมูลได้
  • การวิเคราะห์องค์ประกอบอิสระ:
    • แยกส่วนประกอบอิสระ (ปัจจัย) จากข้อมูลหลายตัวแปร
    • เพิ่มค่า non-Gaussianity ของส่วนประกอบโดยประมาณให้สูงสุด
    • รองรับการฟอกขาวและการลดไดเมนชัน
    • สร้างตารางข้อมูลเอาต์พุตที่มีส่วนประกอบอิสระและตัวแปรที่ถูกฟอกขาว
    • ใช้การไม่มีสหสัมพันธ์แบบสมมาตร ซึ่งคำนวณส่วนประกอบอิสระทั้งหมดพร้อมกัน
    • ใช้การไม่มีสหสัมพันธ์แบบยุบ ซึ่งแยกส่วนประกอบอิสระออกตามลำดับ
  • โมเดลผสมเชิงเส้น:
    • รองรับโครงสร้างความแปรปรวนร่วมมากมาย เช่น ตัวประกอบความแปรปรวน, ความสมมาตรแบบผสม, ไม่มีโครงสร้าง, AR(1), Toeplitz, การวิเคราะห์ปัจจัย ฯลฯ
    • ให้อัลกอริธึมเมทริกซ์หนาแน่นและกระจัดกระจายเฉพาะ
    • รองรับวิธีการประมาณค่า REML และ ML ซึ่งนำไปใช้กับอัลกอริธึมการหาค่าที่เหมาะสมที่หลากหลาย
    • มอบคุณสมบัติการอนุมาน รวมถึงค่าคลาดเคลื่อนมาตรฐานและการทดสอบ t สำหรับเอฟเฟกต์คงที่และแบบสุ่ม
    • รองรับข้อมูลค่าตัวเลขทางธุรกิจซ้ำ
  • การทำคลัสเตอร์ตามโมเดล:
    • จำลองการสังเกตโดยใช้ส่วนผสมของการแจกแจงแบบเกาส์เซียนหลายตัวแปร
    • อนุญาตให้มีส่วนประกอบนอยส์และการเลือกโมเดลอัตโนมัติ
    • มีการให้คะแนนตามหลังและการตีความผลลัพธ์แบบกราฟิก

สถิติเชิงพรรณนา (Descriptive statistics)

สถิติเชิงพรรณนา (Descriptive statistics)

  • ตัวนับที่เด่นชัดเพื่อเข้าใจจำนวนสมาชิกในเซ็ตทางคณิตศาสตร์ที่ให้มา (Cardinality)
  • ทำแผนภาพกล่อง (box plot) เพื่อดูค่ากลางและการกระจาย รวมถึงค่าผิดปกติของตัวแปรอย่างน้อยหนึ่งตัว
  • ความสัมพันธ์เพื่อวัดค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันสำหรับชุดของตัวแปร รองรับการวิเคราะห์แบบจัดกลุ่มและถ่วงน้ำหนัก
  • สามารถช่วยคุณทำ cross-tabulations ได้ รวมถึงรองรับการใช้งานตัวเลือกสำหรับน้ำหนักข้อมูลต่างๆ ที่เกี่ยวข้อง
  • ตารางการณ์จร (contingency table) ที่ประกอบไปด้วยการวัดความสัมพันธ์
  • Histograms ที่มีตัวเลือกในการควบคุมค่า binning, maximum value thresholds, ค่าผิดปกติ และอื่น ๆ
  • สรุปข้อมูลหลายมิติในการส่งผ่านข้อมูลแบบครั้งเดียว
  • เปอร์เซ็นไทล์ของตัวแปรอย่างน้อยหนึ่งตัว
  • ข้อสรุปทางสถิติ อย่างเช่น จำนวนค่าสังเกต จำนวนค่าสูญหาย ผลรวมของค่าที่ไม่ได้สูญหาย ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน ค่าคลาดเคลื่อนมาตรฐาน corrected sums of squares และ uncorrected sums of squares ค่าต่ำสุดและค่าสูงสุด และสัมประสิทธิ์การแปรผัน
  • ค่าประมาณการความหนาแน่นของ Kernel (Kernel density estimates) ที่ใช้ฟังก์ชัน normal ฟังก์ชัน Tri-cube และ ฟังก์ชัน Quadratic Kernel
  • คุณสามารถสร้างตาราง frequency tables และ cross-tabulation tables ได้ ตั้งแต่แบบพื้นฐานหรือ one-way ไปจนถึงแบบที่ซับซ้อนหรือ n-way ตามข้อมูลที่คุณมี

ใช้งานฟังก์ชั่น Group-by processing

ใช้งานฟังก์ชั่น Group-by processing

  • ให้คุณสร้างแบบจำลอง รวมถึงประมวลผลและใช้งานผลลัพธ์ที่ได้อย่างสะดวกรวดเร็วสำหรับข้อมูลแต่ละกลุ่มโดยไม่จำเป็นต้องเสียเวลาไปกับการจัดกลุ่มหรือหมวดหมู่แก่ข้อมูลซ้ำๆ ทุกครั้งที่ทำงาน
  • คุณสามารถสร้างแบบจำลองในลักษณะ segment-based ได้ทันที (เช่น รูปแบบ stratified modeling) จากแผนผังการตัดสินใจแบบ decision tree หรือ clustering analysis

สามารถทำการเปรียบเทียบ ประเมิน และให้คะแนนระหว่างแบบจำลองต่างๆ ได้

สามารถทำการเปรียบเทียบ ประเมิน และให้คะแนนระหว่างแบบจำลองต่างๆ ได้

  • ระบบสามารถทำการสร้างรายงานสรุปเปรียบเทียบแบบจำลองชุดต่าง ๆ ให้คุณได้หลากหลายรูปแบบ ไม่ว่าจะเป็น lift charts, ROC charts, concordance statistics และ misclassification tables สำหรับแบบจำลองไม่ว่าหนึ่งชุดหรือจำนวนมากในเวลาเดียวกัน
  • ให้คุณสามารถทำการเลือกจุด prediction cutoff ได้อย่างสะดวกง่ายดาย เพื่อการอัปเดตค่าสถิติสำหรับการประเมิน และตารางข้อมูลต่างๆ
  • ให้คุณสามารถประเมินและตรวจหาการเกิด lift ในตำแหน่งเปอร์เซ็นไทล์ต่าง ๆ ที่คุณต้องการ
  • คุณยังสามารถส่งออกแบบจำลองของคุณในรูปของ SAS data step code ซึ่งช่วยให้คุณสามารถนำแบบจำลองเหล่านี้ไปใช้งานร่วมกับแอปพลิเคชั่นอื่น ๆ ได้ตามที่ต้องการ ชุด score code จะถูกเชื่อมต่อเข้าด้วยกันโดยอัตโนมัติหากแบบจำลองใช้ชุดผลลัพธ์ที่ได้จากแบบจำลองอื่นๆ (เช่น leaf ID และ cluster ID เป็นต้น)

Model scoring

Model scoring

  • คุณยังสามารถส่งออกแบบจำลองของคุณในรูปของ SAS data step code ซึ่งช่วยให้คุณสามารถนำแบบจำลองเหล่านี้ไปใช้งานร่วมกับแอปพลิเคชั่นอื่น ๆ ได้ตามที่ต้องการ
  • ชุด score code จะถูกเชื่อมต่อเข้าด้วยกันโดยอัตโนมัติหากแบบจำลองใช้ชุดผลลัพธ์ที่ได้จากแบบจำลองอื่นๆ (เช่น leaf ID และ cluster ID เป็นต้น)

โปรแกรมรันไทม์ SAS Viya ในหน่วยความจำ

โปรแกรมรันไทม์ SAS Viya ในหน่วยความจำ

  • SAS Cloud Analytic Services (CAS) จะทำการประมวลผลหน่วยความจำและกระจายการประมวลผลไปตาม node ต่างๆ ที่อยู่ในคลัสเตอร์
  • คำสั่งจากผู้ใช้ (ซึ่งแปลงเป็นภาษาคำสั่งสำหรับการทำงานของระบบ) จะได้รับการแปลงเป็นขั้นตอนการทำงานต่างๆ พร้อมกับค่าพารามิเตอร์ที่สำคัญสำหรับการทำงานในระบบที่ต้องอาศัยการส่งต่อและแบ่งปันข้อมูลระหว่างกัน ชุดผลลัพธ์และข้อความที่เกี่ยวข้องจะถูกส่งกลับมายังขั้นตอนการดำเนินการ เพื่อที่ผู้ใช้จะสามารถดำเนินการในลำดับต่อไป
  • ข้อมูลสามารถถูกจัดเก็บในรูปของบล็อกข้อมูลและสามารถทำการโหลดใช้งานได้จากหน่วยความจำทุกเมื่อที่คุณต้องการ หากตารางต่าง ๆ มีขนาดใหญ่เกินกว่าปริมาณหน่วยความจำที่บรรจุได้ เซิร์ฟเวอร์จะทำการเก็บบล็อกข้อมูลต่าง ๆ ไว้ในรูปแบบของแคช (cache) แทน เก็บข้อมูลและผลลัพธ์ขั้นกลางไว้ในหน่วยความจำได้นานเท่าที่คุณต้องการ สำหรับหลากหลายส่วนงานและขอบเขตของผู้ใช้
  • อัลกอริทึมจะกำหนดจำนวน node ที่เหมาะสมที่สุดสำหรับงานแต่ละชิ้น
  • ชุดระบบการสื่อสารที่มีประสิทธิภาพช่วยรองรับในกรณีที่เกิดความผิดพลาดและช่วยให้คุณสามารถลบหรือเพิ่ม node ข้อมูลในเซิร์ฟเวอร์ได้แม้ในขณะที่กำลังดำเนินงาน องค์ประกอบทุกส่วนในงานของคุณสามารถทำซ้ำเพิ่มได้ในอนาคต เพื่อเพิ่มศักยภาพการทำงานของคุณ
  • ผลิตภัณฑ์ของเราสามารถใช้งานได้ในโหมดสำหรับผู้ใช้หลายราย เพื่อให้ซอฟท์แวร์ส่วนรวมที่คุณมีสามารถใช้งานได้สำหรับผู้ใช้ที่แยกกลุ่มไว้โดยเฉพาะ