รายการคุณสมบัติของ SAS Visual Statistics
การสำรวจและค้นพบข้อมูลผ่านการแสดงภาพ (ใช้งานผ่าน SAS Visual Analytics)
การสำรวจและค้นพบข้อมูลผ่านการแสดงภาพ (ใช้งานผ่าน SAS Visual Analytics)
- ช่วยให้คุณสามารถตีความตัวแปรและความสัมพันธ์ที่ซับซ้อนต่างๆ ในชุดฐานข้อมูลขนาดใหญ่ ซึ่งส่งผลต่อผลลัพธ์การพยากรณ์จากแบบจำลอง
- คุณสามารถทำการคัดกรองรายการข้อมูลต่างๆ และเข้าใจระดับอิทธิพลของตัวแปรต่างๆ ที่ส่งผลต่อแบบจำลองของคุณได้อย่างง่ายดายยิ่งขึ้น
- ทำการตรวจจับข้อมูลที่มีค่าผิดปกติ รวมถึงข้อมูลที่ส่งผลต่อความแม่นยำของการพยากรณ์ เพื่อให้คุณทำการตัดสินใจและขจัดข้อมูลที่ผิดปกติออกจากการวิเคราะห์ของคุณ เช่น ในการใช้งานแบบจำลอง
- คุณยังสามารถสำรวจชุดข้อมูลที่มีได้ด้วยแผนภาพและแผนภูมิต่างๆ ไม่ว่าจะเป็น แผนภูมิแท่ง (bar charts), ฮิสโทแกรม (histograms), แผนภาพกล่อง (box plots), ฮีทแม็พ (heat maps), แผนภาพบับเบิ้ล (bubble plots), แผนที่ภูมิศาสตร์ (geographic maps) และรูปแบบอื่นๆ อีกมากมาย
- ให้คุณคำนวณผลลัพธ์เพื่อการพยากรณ์ต่าง ๆ ที่สามารถนำไปใช้งานได้ในแบบจำลองหรือการแสดงผลเชิงภาพได้โดยตรง ผลลัพธ์ที่คุณได้นั้น ยังสามารถบันทึกและส่งต่อไปยังฝ่ายงานหรือหน่วยธุรกิจอื่น ๆ ที่มิได้ทำงานกับแบบจำลองโดยตรง หรือไม่มีขีดความสามารถด้านแบบจำลองได้อีกด้วย
- แปลงตัวแปรค่าตัวเลขทางธุรกิจที่มีสองระดับเป็นตัวแปรหมวดหมู่โดยอัตโนมัติเมื่อเปิดชุดข้อมูลเป็นครั้งแรก
ให้คุณเข้าถึงเทคนิคการวิเคราะห์ต่างๆ ได้ด้วยระบบอินเตอร์เฟสเชิงภาพ
ให้คุณเข้าถึงเทคนิคการวิเคราะห์ต่างๆ ได้ด้วยระบบอินเตอร์เฟสเชิงภาพ
- การจัดกลุ่ม (Clustering):
- คุณสามารถใช้งานฟังก์ชั่น k-means, k-modes หรือ k-prototypes clustering ได้
- สามารถทำการเปรียบเทียบแผนภาพคอร์ดิเนต (coordinate plots) เพื่อให้คุณทำการประเมินข้อมูลภายในคลัสเตอร์ต่างๆ อย่างมีประสิทธิภาพ
- สร้างแผนภาพการกระจาย (scatter plots) สำหรับชุดข้อมูลขนาดเล็ก และ heat maps สำหรับชุดข้อมูลขนาดใหญ่ พร้อมฟังก์ชั่น cluster profiles สำหรับแผนภาพทั้งสองแบบ
- แสดงผลของค่าสถิติเชิงพรรณนาโดยละเอียดไม่ว่าจะเป็นค่าเฉลี่ย หรือจำนวนข้อมูล (number of observations) ในแต่ละคลัสเตอร์ เป็นต้น
- ให้คุณสามารถสร้าง cluster ID ได้ทันทีที่ต้องการ โดยแสดงผลในคอลัมน์ชุดใหม่
- รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
- แผนผังการตัดสินใจแบบต้นไม้ (decision trees):
- นอกจากนี้ ยังรองรับฟังก์ชั่นสำหรับสร้างแผนผังตัดสินใจแบบต้นไม้จัดกลุ่ม (classification trees) และแผนผังตัดสินใจแบบต้นไม้สำหรับทำนายค่า (regression trees)
- บนพื้นฐานของอัลกอริทึมแบบ modified C4.5 หรือ cost-complexity pruning
- ให้คุณสามารถจัดทำและย่อยแผนผังต้นไม้ลงได้อย่างสะดวกง่ายดาย สร้างต้นไม้ย่อย (subtree) ขึ้นอย่างง่ายดาย
- คุณสามารถกำหนดความละเอียดของแผนผังต้นไม้ รวมถึงจำนวนกิ่งของการวิเคราะห์สูงสุด ขนาดของ node ย่อย (leafs) รวมถึงระดับการยุบรวมแผนผัง (pruning) และอื่นๆ อีกมากมาย
- ใช้ฟังก์ชั่นการแสดงผลสำหรับแผนผังต้นไม้เพื่อให้คุณสามารถเจาะลึกและพิจารณาส่วนต่างๆ ของแผนผังต้นไม้ได้อย่างคล่องแคล่ว
- ให้คุณสามารถสร้าง leaf ID, ค่าประมาณการต่าง ๆ และค่า residuals ได้ทันทีที่ต้องการ โดยแสดงผลในคอลัมน์ชุดใหม่
- รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
- รองรับการกำจัดออกด้วยข้อมูลที่ถูกเลือก
- รองรับการจูนอัตโนมัติด้วยตัวเลือกสำหรับขนาดของโหนดปลายสุด
- เปิดใช้งานการแก้ไขจุดแยกด้วยตนเองสำหรับแผนผังแบบอินเทอร์แอคทีฟ
- สมการถดถอยเชิงเส้น (linear regression):
- ค่า influence statistics
- รองรับการเลือกตัวแปรทั้งแบบ forward, backward, stepwise และแบบ lasso selection ตามความต้องการของคุณ
- กราฟการเกิดซ้ำสำหรับการเลือกตัวแปร
- ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
- การวิเคราะห์ค่า residual (residual diagnostics)
- ตารางสรุปผลสามารถรวบรวมผลลัพธ์ต่าง ๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็น overall ANOVA, ค่าสถิติเกี่ยวกับมิติของแบบจำลอง, ค่าสถิติ fit statistics, model ANOVA, Type III test และการประมาณค่าพารามิเตอร์ต่างๆ
- ให้คุณสามารถทำการคำนวณค่าประมาณและค่า residuals ต่างๆ ได้ทันทีที่ต้องการ โดยแสดงผลในคอลัมน์ชุดใหม่
- รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
- แบบจำลองถดถอยแบบ logistic regression:
- แบบจำลองสำหรับข้อมูลประเภท binary data ซึ่งมาพร้อมกับฟังก์ชั่นแบบจำลองแบบ logit และ probit
- ค่า influence statistics
- รองรับการเลือกตัวแปรทั้งแบบ forward, backward, stepwise และแบบ lasso selection ตามความต้องการของคุณ
- กราฟการเกิดซ้ำสำหรับการเลือกตัวแปร
- ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
- การวิเคราะห์ค่า residual (residual diagnostics)
- ตารางสรุปผลสามารถรวบรวมค่าสถิติต่างๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็น มิติของแบบจำลอง ประวัติการทำงานซ้ำ (iteration history) สถานะ convergence status, Type III test การประมาณค่าตัวแปร และ response profile
- ให้คุณสามารถทำการคำนวณค่าประมาณสำหรับหมวดหมู่ และค่าประมาณสำหรับความน่าจะเป็นของเหตุการณ์ต่าง ๆ โดยแสดงผลในคอลัมน์ชุดใหม่ ให้คุณสามารถปรับแต่งค่า prediction cutoff เพื่อกำหนดกลุ่มให้กับข้อมูลแต่ละรายการว่าอยู่ในประเภท event หรือ non-event
- รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
- แบบจำลองแบบ generalized linear model:
- รองรับรูปแบบการแจกแจงข้อมูลหลากหลายรูปแบบไม่ว่าจะเป็น beta, normal, binary, exponential, gamma, geometric, Poisson, Tweedie, inverse Gaussian และ negative binomial
- รองรับการเลือกตัวแปรทั้งแบบ forward, backward, stepwise และแบบ lasso selection ตามความต้องการของคุณ
- รองรับตัวแปรออฟเซ็ต (Offset variable support)
- ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
- การวิเคราะห์ค่า residual (residual diagnostics)
- ตารางสรุปผลสามารถรวบรวมค่าสถิติต่าง ๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็นข้อมูลภาพรวมของแบบจำลอง ประวัติการทำงานซ้ำ (iteration history) ค่า fit statistics ตารางสำหรับ Type III test และการประมาณค่าตัวแปร
- มีตัวเลือกการจัดการข้อมูลที่ตกหล่นหรือขาดหายไปเพื่อช่วยให้คุณจัดการกับข้อมูลที่ตกหล่นไปในส่วนของตัวแปร predictor variable ได้
- ให้คุณสามารถทำการคำนวณค่าประมาณและค่า residuals ต่างๆ ได้ทันทีที่ต้องการ โดยแสดงผลในคอลัมน์ชุดใหม่
- รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
- แบบจำลองแบบ Generalized additive model:
- รองรับรูปแบบการแจกแจงข้อมูลหลากหลายรูปแบบไม่ว่าจะเป็น normal, binary, gamma, Poisson, Tweedie, inverse Gaussian และ negative binomial
- รองรับการทำงานกับ spline effects ทั้งแบบหนึ่งมิติและสองมิติ
- วิธีการวิเคราะห์แบบ GCV GACV และ UBRE สำหรับเลือก smoothing effects ที่เหมาะสม
- รองรับตัวแปรออฟเซ็ต (Offset variable support)
- ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
- การวิเคราะห์ค่า residual (residual diagnostics)
- ตารางสรุปผลสามารถรวบรวมค่าสถิติต่าง ๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็น ข้อมูลภาพรวมของแบบจำลอง ประวัติการทำงานซ้ำ (iteration history) ค่า fit statistics และการประมาณค่าตัวแปร
- รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
- แบบจำลองถดถอยแบบ nonparametric logistic regression:
- มีแบบจำลองสำหรับข้อมูลประเภท binary data หลายรูปแบบ ทั้ง logit, probit, log-log และ c-log-log-link
- รองรับการทำงานกับ spline effects ทั้งแบบหนึ่งมิติและสองมิติ
- วิธีการวิเคราะห์แบบ GCV GACV และ UBRE สำหรับเลือก smoothing effects ที่เหมาะสม
- รองรับตัวแปรออฟเซ็ต (Offset variable support)
- ค่าตัวแปรทั้งแบบ frequency variables และ weight variables
- การวิเคราะห์ค่า residual (residual diagnostics)
- ตารางสรุปผลสามารถรวบรวมค่าสถิติต่าง ๆ ที่สำคัญไว้ได้ด้วยกันไม่ว่าจะเป็น ข้อมูลภาพรวมของแบบจำลอง ประวัติการทำงานซ้ำ (iteration history) ค่า fit statistics และการประมาณค่าตัวแปร
- รองรับการใช้งานที่เกี่ยวข้องกับ holdout data (ในรูปแบบ training and validation) เพื่อประโยชน์ในการประเมินแบบจำลองของคุณ
ช่วยให้คุณสามารถใช้งานเทคนิคการวิเคราะห์ต่าง ๆ ผ่านฟังก์ชั่นด้านการเขียนโปรแกรม
การเขียนโปรแกรมเข้าถึงเทคนิคการวิเคราะห์
- โปรแกรมเมอร์และผู้เชี่ยวชาญหรือ data scientists ของคุณ สามารถเข้าใช้งาน SAS Viya (เซิร์ฟเวอร์ CAS) ได้จาก SAS Studio ด้วยระบบการทำงานของ SAS เช่น PROCs และชุดคำสั่งการทำงานอื่นๆ
- โปรแกรมเมอร์ของคุณสามารถใช้ชุดคำสั่ง CAS ต่าง ๆ ได้ด้วยคำสั่งของ PROC CAS หรือแม้แต่ทำงานผ่านระบบภาษาอื่น ๆ ไม่ว่าจะเป็น Python, R, Lua และ Java
- ผู้ใช้งานสามารถใช้ระบบ SAS Viya (บน เซิร์ฟเวอร์ CAS) จากแอปพลิเคชั่นของตนเองได้ ผ่าน REST API สาธารณะ
- พร้อมผสานการทำงานกับ Python Pandas DataFrames ได้ทันที โปรแกรมเมอร์ผู้เชี่ยวชาญการใช้ภาษา Python ของคุณ สามารถทำการอัปโหลด DataFrames ไปยัง CAS และสามารถดึงผลลัพธ์ต่าง ๆ ใน CAS ไปยัง DataFrames ได้อย่างสะดวกยิ่งขึ้น และยังสามารถทำงานร่วมกับโปรแกรมภาษา Python อื่นๆ เช่น Pandas, matplotlib, Plotly และ Bokeh เป็นต้น
- รวมซอฟต์แวร์ SAS/STAT® และ SAS/GRAPH®
- การวิเคราะห์แบบ principal component analysis (PCA):
- สามารถทำการลดมิติของชุดข้อมูล (dimension reduction) ได้ โดยการคำนวณข้อมูลส่วนประกอบที่สำคัญ
- ให้คุณสามารถใช้งานอัลกอริทึมและคำสั่งต่าง ๆ ไม่ว่าจะเป็น eigenvalue decomposition และอัลกอริทึม NIPALS และ ITERGS
- แสดงผลลัพธ์ค่าคะแนนแบบ principal component score สำหรับรายการข้อมูลต่างๆ
- สร้าง scree plots และ pattern profile plots
- แผนผังการตัดสินใจแบบต้นไม้ (decision trees):
- รองรับการใช้งานสำหรับ classification trees และ regression trees
- รองรับฟังก์ชั่นการทำงานทั้งในรูปแบบของหมวดหมู่และตัวเลข
- ช่วยคุณใช้งานเกณฑ์ (criteria) ต่าง ๆ สำหรับการแยก node ออกจากกัน โดยอ้างอิงกับการวัด impurity ของข้อมูล และการทดสอบทางสถิติ
- พร้อมมอบฟังก์ชั่นการตัดแต่งหรือย่อยแผนผังต้นไม้ในรูปแบบ cost-complexity method และ reduced error method ให้กับคุณ
- รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
- รองรับการใช้ validation data เพื่อเลือกใช้งานชุด subtree ที่ดีที่สุดสำหรับคุณ
- รองรับการใช้ test data เพื่อการประเมินคุณภาพของแบบจำลอง tree model ในขั้นท้ายสุด
- สนับสนุนคุณด้วยเครื่องมือการจัดการกับค่าข้อมูลที่หายไป ซึ่งมีหลากหลายวิธี เช่น surrogate rules เป็นต้น
- สร้างแผนผังแบบต้นไม้หรือ tree diagram
- แสดงค่าสถิติสำหรับประเมินแบบจำลอง รวมถึงสถิติที่ละเอียดประเภท resubstitution statistics อีกด้วย
- ทำการคำนวณเกณฑ์ชี้วัดความสำคัญของตัวแปรต่างๆ
- แสดงผลของ leaf assignments และค่าการพยากรณ์สำหรับข้อมูลของคุณ
- การจัดกลุ่ม (Clustering):
- มาพร้อมกับอัลกอริทึมแบบ k-means algorithm เพื่อทำการจัดคลัสเตอร์สำหรับตัวแปรที่มีลักษณะเป็นค่าต่อเนื่อง (continuous/interval variables)
- สามารถใช้งานอัลกอริทึมแบบ k-modes เพื่อทำการจัดคลัสเตอร์ตัวแปรที่เป็นค่าตัวเลข
- สามารถใช้งานการวัดระยะห่างแบบต่าง ๆ เพื่อพิจารณาความคล้ายคลึงของข้อมูลตำแหน่งต่าง ๆ
- สามารถใช้งานเทคนิค aligned box criterion method เพื่อการประมาณการจำนวนของคลัสเตอร์
- แสดงผลการรวมกลุ่มของคลัสเตอร์ข้อมูลและการวัดระยะห่างของรายการข้อมูลต่าง ๆ
- สมการถดถอยเชิงเส้น (linear regression):
- รองรับการทำงานกับแบบจำลองเชิงเส้น และตัวแปรประเภท continuous variables และ classification variables
- รองรับการทำงานกับพารามิเตอร์ต่าง ๆ หลากหลายรูปแบบ เพื่อการวิเคราะห์ classification effects
- รองรับการทำงานกับ interaction effects และ nested effects ทุกรูปแบบ
- รองรับการทำงานกับ polynomial effects และ spline effects
- รองรับการเลือกตัวแปรทั้งแบบ forward, backward, stepwise, least angle regression และแบบ lasso selection ตามความต้องการของคุณ
- รองรับการใช้งาน information criteria และเครื่องมือในการทำ validation สำหรับข้อมูลหลากหลายประเภท เพื่อช่วยในการคัดเลือกแบบจำลองที่เหมาะสำหรับคุณที่สุด
- ให้คุณสามารถเลือกระดับการทำ classification effects ในระดับต่างๆ ตามที่คุณต้องการ
- รักษาลำดับชั้นของผลกระทบต่างๆ ของแบบจำลองเอาไว้
- รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
- มาพร้อมกับค่าสถิติต่าง ๆ ที่หลากหลายสำหรับการวิเคราะห์และประเมินผล
- สร้าง SAS code สำหรับการให้คะแนนรูปแบบ production scoring
- แบบจำลองถดถอยแบบ logistic regression:
- รองรับ binary responses และ binomial responses
- รองรับการทำงานกับพารามิเตอร์ต่าง ๆ หลากหลายรูปแบบ เพื่อการวิเคราะห์ classification effects
- รองรับการทำงานกับ interaction effects และ nested effects ทุกรูปแบบ
- รองรับการทำงานกับ polynomial effects และ spline effects
- รองรับการเลือกตัวแปรทั้งแบบ forward, backward, fast backward และแบบ lasso selection ตามความต้องการของคุณ
- รองรับการใช้งาน information criteria และเครื่องมือในการทำ validation สำหรับข้อมูลหลากหลายประเภท เพื่อช่วยในการคัดเลือกแบบจำลองที่เหมาะสำหรับคุณที่สุด
- ให้คุณสามารถเลือกระดับการทำ classification effects ในระดับต่างๆ ตามที่คุณต้องการ
- รักษาลำดับชั้นของผลกระทบต่างๆ ของแบบจำลองเอาไว้
- รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
- ให้ผลค่าสถิติต่าง ๆ มากหลายประเภท เพื่อประโยชน์ในการประเมินผลของแบบจำลองของคุณ
- มีฟังก์ชั่นการปรับตั้งค่าที่เหมาะสมที่หลากหลายสำหรับแบบจำลองแบบ maximum likelihood
- แบบจำลองแบบ generalized linear model:
- รองรับการทำงานร่วมกับลักษณะการแจกแจงข้อมูลที่หลากหลาย เช่นรูปแบบ binary, normal, Poisson และ gamma
- รองรับการทำงานกับพารามิเตอร์ต่าง ๆ หลากหลายรูปแบบ เพื่อการวิเคราะห์ classification effects
- รองรับการทำงานกับ interaction effects และ nested effects ทุกรูปแบบ
- รองรับการทำงานกับ polynomial effects และ spline effects
- รองรับการเลือกตัวแปรทั้งแบบ forward, backward, fast backward, stepwise และแบบ group lasso selection ตามความต้องการของคุณ
- รองรับการใช้งาน information criteria และเครื่องมือในการทำ validation สำหรับข้อมูลหลากหลายประเภท เพื่อช่วยในการคัดเลือกแบบจำลองที่เหมาะสำหรับคุณที่สุด
- ให้คุณสามารถเลือกระดับการทำ classification effects ในระดับต่างๆ ตามที่คุณต้องการ
- รักษาลำดับชั้นของผลกระทบต่างๆ ของแบบจำลองเอาไว้
- รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
- ให้ผลค่าสถิติต่าง ๆ มากหลายประเภท เพื่อประโยชน์ในการประเมินผลของแบบจำลองของคุณ
- มีฟังก์ชั่นการปรับตั้งค่าที่เหมาะสมที่หลากหลายสำหรับแบบจำลองแบบ maximum likelihood
- แบบจำลองถดถอยแบบ nonlinear regression:
- มาพร้อมกับฟังก์ชั่นสำหรับแบบจำลองทั้งแบบ standard distribution และ general distribution
- ระบบจะทำการคำนวณค่าพารามิเตอร์จากคำสั่งที่คุณกำหนดเอง เพื่อให้ได้ผลการประมาณค่าที่มีความแม่นยำสูง
- และประมวลผลคำสั่งที่คุณป้อนเข้าสู่ระบบด้วยชุดคำสั่ง ESTIMATE และ PREDICT
- จำเป็นต้องมีชุดข้อมูลที่มี CMP item store หากมิได้ใช้งานชุดคำสั่ง PROC NLMOD
- ทำการประมาณค่าพารามิเตอร์ต่าง ๆ ด้วยวิธี least squares
- ทำการประมาณค่าพารามิเตอร์ต่าง ๆ ด้วยวิธี maximum likelihood
- แบบจำลองถดถอยแบบ quantile regression:
- รองรับฟังก์ชั่นการทำงานสมการถดถอยแบบ quantile regression สำหรับระดับควอนไทล์ทั้งแบบ single quantile level และ multiple quantile levels
- รองรับการทำงานร่วมกับพารามิเตอร์ที่หลากหลาย (multiple parameterizations) เพื่อการจัดหมวดหมู่ของตัวแปร
- รองรับการทำงานกับ interaction effects (แบบ crossed effects) และ nested effects ทุกรูปแบบ
- รองรับการใช้งานเพื่อการคัดเลือกหรือคัดกรองแบบจำลองในรูปของ hierarchical model selection strategy จากค่าผลกระทบ (effects) ต่าง ๆ ได้
- ให้คุณสามารถเลือกใช้งานฟังก์ชั่น effect-selection methods ที่หลากหลายได้
- ให้คุณสามารถใช้งานฟังก์ชั่น effect selection ได้โดยผ่านเกณฑ์การเลือกที่หลากหลายตามความต้องการ
- รองรับการทำงานของ stopping rules และ selection rules
- แบบจำลองแบบ predictive partial least squares model:
- มีภาษา syntax สำหรับเขียนโปรแกรมที่รองรับตัวแปรเพื่อการจัดหมวดหมู่ต่าง ๆ ตัวแปรที่เป็นค่าต่อเนื่อง และการตอบสนองระหว่างตัวแปรต่าง ๆ รวมถึง nestings
- มีชุดคำสั่งในรูปแบบ effect-construction syntax เพื่อการใช้งานสำหรับ polynomial effects และ spline effects
- รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles และ testing roles
- ให้คุณสามารถทำการทดสอบแบบ set validation ได้ เพื่อให้คุณสามารถเลือกจำนวนของตัวแปรประเภท extracted factors
- สามารถใช้งานเทคนิคการวิเคราะห์ทางสถิติต่าง ๆ ได้ไม่ว่าจะเป็น principal component regression, reduced rank regression และ partial least squares regression
- แบบจำลองแบบ Generalized additive model:
- ทำการปรับแต่งแบบจำลองแบบ generalized additive models โดยอาศัย low-rank regression spline ต่าง ๆ ที่มีอยู่
- ทำการประมาณค่าพารามิเตอร์สำหรับสมการถดถอย ด้วยวิธี penalized likelihood estimation
- ทำการประมาณค่าพารามิเตอร์แบบ smoothing parameters โดยสามารถใช้งานได้ทั้งวิธี performance iteration method หรือ outer iteration method
- ทำการประมาณค่าพารามิเตอร์ของสมการถดถอยด้วยวิธี maximum likelihood
- สามารถทดสอบผลของ spline term ต่าง ๆ ได้ ผ่านการใช้ Wald statistic
- มาพร้อมกับภาษา syntax เพื่อการสร้างแบบจำลองซึ่งสามารถรองรับตัวแปรเพื่อการจัดหมวดหมู่ต่างๆ ตัวแปรที่เป็นค่าต่อเนื่อง และการตอบสนองระหว่างตัวแปรต่าง ๆ รวมถึง nestings
- คุณจะสามารถสร้าง spline term ขึ้นมาด้วยตัวแปรที่หลากหลาย
- แบบจำลองถดถอยแบบ proportional hazard regression:
- ให้คุณทำการปรับตั้งค่าสำหรับแบบจำลองถดถอยแบบ Cox proportional hazards regression เพื่อให้สามารถรองรับข้อมูลแบบ survival data และให้คุณทำการเลือกตัวแปรต่าง ๆ ได้ตามที่ต้องการ
- พร้อมการทำงานจากภาษา Syntax เพื่อการสร้างแบบจำลองด้วยตัวแปรเพื่อการจัดหมวดหมู่ต่างๆ ตัวแปรที่เป็นค่าต่อเนื่อง และการตอบสนองระหว่างตัวแปรต่าง ๆ รวมถึง nestings
- มีชุดคำสั่งในรูปแบบ effect-construction syntax เพื่อการใช้งานสำหรับ polynomial effects และ spline effects
- ให้คุณสามารถใช้งานการประมาณค่าแบบ maximum partial likelihood estimation รวมทั้งทำการวิเคราะห์แบบ stratified analysis และทำการเลือกตัวแปรได้
- รองรับฟังก์ชั่นสำหรับแบ่งข้อมูลออกเป็นกลุ่ม training roles, validation roles และ testing roles
- รองรับการวิเคราะห์แบบ weighted analysis และแบบ grouped analysis
- การควบคุมกระบวนการทางสถิติ (statistical process control):
- สามารถใช้งาน Shewhart control chart analysis ได้
- ทำการวิเคราะห์ตัวแปรประเภท process variables ต่าง ๆ เพื่อตรวจจับขั้นตอนใดๆ ที่อาจก่อปัญหาทางสถิติขึ้น
- ทำการปรับแต่งขอบเขตของข้อมูลหรือ control limits ในกรณีที่ชุดข้อมูลย่อยต่าง ๆ มีขนาดแตกต่างกัน
- สามารถทำการประมาณค่า control limits จากชุดข้อมูลได้ รวมถึงคำนวณค่า control limits จากค่าเฉพาะเจาะจงเพื่อการหาค่าพารามิเตอร์ของกลุ่มประชากร (ในรูปแบบ known standards) รวมไปถึงการอ่านค่าขอบเขตจากชุดข้อมูลที่มีอยู่
- สามารถทำการทดสอบ (tests) ต่างๆ สำหรับกรณีการวิเคราะห์พิเศษต่าง ๆ (เช่น การทดสอบตามแนวทาง Western Electric Rules)
- ทำการประมาณค่าส่วนเบี่ยงเบนมาตรฐานในขั้นตอนการทำงานต่างๆ ด้วยหลากหลายวิธี (ใช้ได้สำหรับการทำงานแผนภาพ variable charts เท่านั้น)
- ให้คุณเซฟสถิติเกี่ยวกับแผนภาพต่าง ๆ และควบคุมขอบเขตของค่าต่างๆ ในตารางแสดงผลข้อมูลได้
- การวิเคราะห์องค์ประกอบอิสระ:
- แยกส่วนประกอบอิสระ (ปัจจัย) จากข้อมูลหลายตัวแปร
- เพิ่มค่า non-Gaussianity ของส่วนประกอบโดยประมาณให้สูงสุด
- รองรับการฟอกขาวและการลดไดเมนชัน
- สร้างตารางข้อมูลเอาต์พุตที่มีส่วนประกอบอิสระและตัวแปรที่ถูกฟอกขาว
- ใช้การไม่มีสหสัมพันธ์แบบสมมาตร ซึ่งคำนวณส่วนประกอบอิสระทั้งหมดพร้อมกัน
- ใช้การไม่มีสหสัมพันธ์แบบยุบ ซึ่งแยกส่วนประกอบอิสระออกตามลำดับ
- โมเดลผสมเชิงเส้น:
- รองรับโครงสร้างความแปรปรวนร่วมมากมาย เช่น ตัวประกอบความแปรปรวน, ความสมมาตรแบบผสม, ไม่มีโครงสร้าง, AR(1), Toeplitz, การวิเคราะห์ปัจจัย ฯลฯ
- ให้อัลกอริธึมเมทริกซ์หนาแน่นและกระจัดกระจายเฉพาะ
- รองรับวิธีการประมาณค่า REML และ ML ซึ่งนำไปใช้กับอัลกอริธึมการหาค่าที่เหมาะสมที่หลากหลาย
- มอบคุณสมบัติการอนุมาน รวมถึงค่าคลาดเคลื่อนมาตรฐานและการทดสอบ t สำหรับเอฟเฟกต์คงที่และแบบสุ่ม
- รองรับข้อมูลค่าตัวเลขทางธุรกิจซ้ำ
- การทำคลัสเตอร์ตามโมเดล:
- จำลองการสังเกตโดยใช้ส่วนผสมของการแจกแจงแบบเกาส์เซียนหลายตัวแปร
- อนุญาตให้มีส่วนประกอบนอยส์และการเลือกโมเดลอัตโนมัติ
- มีการให้คะแนนตามหลังและการตีความผลลัพธ์แบบกราฟิก
สถิติเชิงพรรณนา (Descriptive statistics)
สถิติเชิงพรรณนา (Descriptive statistics)
- ตัวนับที่เด่นชัดเพื่อเข้าใจจำนวนสมาชิกในเซ็ตทางคณิตศาสตร์ที่ให้มา (Cardinality)
- ทำแผนภาพกล่อง (box plot) เพื่อดูค่ากลางและการกระจาย รวมถึงค่าผิดปกติของตัวแปรอย่างน้อยหนึ่งตัว
- ความสัมพันธ์เพื่อวัดค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันสำหรับชุดของตัวแปร รองรับการวิเคราะห์แบบจัดกลุ่มและถ่วงน้ำหนัก
- สามารถช่วยคุณทำ cross-tabulations ได้ รวมถึงรองรับการใช้งานตัวเลือกสำหรับน้ำหนักข้อมูลต่างๆ ที่เกี่ยวข้อง
- ตารางการณ์จร (contingency table) ที่ประกอบไปด้วยการวัดความสัมพันธ์
- Histograms ที่มีตัวเลือกในการควบคุมค่า binning, maximum value thresholds, ค่าผิดปกติ และอื่น ๆ
- สรุปข้อมูลหลายมิติในการส่งผ่านข้อมูลแบบครั้งเดียว
- เปอร์เซ็นไทล์ของตัวแปรอย่างน้อยหนึ่งตัว
- ข้อสรุปทางสถิติ อย่างเช่น จำนวนค่าสังเกต จำนวนค่าสูญหาย ผลรวมของค่าที่ไม่ได้สูญหาย ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน ค่าคลาดเคลื่อนมาตรฐาน corrected sums of squares และ uncorrected sums of squares ค่าต่ำสุดและค่าสูงสุด และสัมประสิทธิ์การแปรผัน
- ค่าประมาณการความหนาแน่นของ Kernel (Kernel density estimates) ที่ใช้ฟังก์ชัน normal ฟังก์ชัน Tri-cube และ ฟังก์ชัน Quadratic Kernel
- คุณสามารถสร้างตาราง frequency tables และ cross-tabulation tables ได้ ตั้งแต่แบบพื้นฐานหรือ one-way ไปจนถึงแบบที่ซับซ้อนหรือ n-way ตามข้อมูลที่คุณมี
ใช้งานฟังก์ชั่น Group-by processing
ใช้งานฟังก์ชั่น Group-by processing
- ให้คุณสร้างแบบจำลอง รวมถึงประมวลผลและใช้งานผลลัพธ์ที่ได้อย่างสะดวกรวดเร็วสำหรับข้อมูลแต่ละกลุ่มโดยไม่จำเป็นต้องเสียเวลาไปกับการจัดกลุ่มหรือหมวดหมู่แก่ข้อมูลซ้ำๆ ทุกครั้งที่ทำงาน
- คุณสามารถสร้างแบบจำลองในลักษณะ segment-based ได้ทันที (เช่น รูปแบบ stratified modeling) จากแผนผังการตัดสินใจแบบ decision tree หรือ clustering analysis
สามารถทำการเปรียบเทียบ ประเมิน และให้คะแนนระหว่างแบบจำลองต่างๆ ได้
สามารถทำการเปรียบเทียบ ประเมิน และให้คะแนนระหว่างแบบจำลองต่างๆ ได้
- ระบบสามารถทำการสร้างรายงานสรุปเปรียบเทียบแบบจำลองชุดต่าง ๆ ให้คุณได้หลากหลายรูปแบบ ไม่ว่าจะเป็น lift charts, ROC charts, concordance statistics และ misclassification tables สำหรับแบบจำลองไม่ว่าหนึ่งชุดหรือจำนวนมากในเวลาเดียวกัน
- ให้คุณสามารถทำการเลือกจุด prediction cutoff ได้อย่างสะดวกง่ายดาย เพื่อการอัปเดตค่าสถิติสำหรับการประเมิน และตารางข้อมูลต่างๆ
- ให้คุณสามารถประเมินและตรวจหาการเกิด lift ในตำแหน่งเปอร์เซ็นไทล์ต่าง ๆ ที่คุณต้องการ
- คุณยังสามารถส่งออกแบบจำลองของคุณในรูปของ SAS data step code ซึ่งช่วยให้คุณสามารถนำแบบจำลองเหล่านี้ไปใช้งานร่วมกับแอปพลิเคชั่นอื่น ๆ ได้ตามที่ต้องการ ชุด score code จะถูกเชื่อมต่อเข้าด้วยกันโดยอัตโนมัติหากแบบจำลองใช้ชุดผลลัพธ์ที่ได้จากแบบจำลองอื่นๆ (เช่น leaf ID และ cluster ID เป็นต้น)
Model scoring
Model scoring
- คุณยังสามารถส่งออกแบบจำลองของคุณในรูปของ SAS data step code ซึ่งช่วยให้คุณสามารถนำแบบจำลองเหล่านี้ไปใช้งานร่วมกับแอปพลิเคชั่นอื่น ๆ ได้ตามที่ต้องการ
- ชุด score code จะถูกเชื่อมต่อเข้าด้วยกันโดยอัตโนมัติหากแบบจำลองใช้ชุดผลลัพธ์ที่ได้จากแบบจำลองอื่นๆ (เช่น leaf ID และ cluster ID เป็นต้น)
โปรแกรมรันไทม์ SAS Viya ในหน่วยความจำ
โปรแกรมรันไทม์ SAS Viya ในหน่วยความจำ
- SAS Cloud Analytic Services (CAS) จะทำการประมวลผลหน่วยความจำและกระจายการประมวลผลไปตาม node ต่างๆ ที่อยู่ในคลัสเตอร์
- คำสั่งจากผู้ใช้ (ซึ่งแปลงเป็นภาษาคำสั่งสำหรับการทำงานของระบบ) จะได้รับการแปลงเป็นขั้นตอนการทำงานต่างๆ พร้อมกับค่าพารามิเตอร์ที่สำคัญสำหรับการทำงานในระบบที่ต้องอาศัยการส่งต่อและแบ่งปันข้อมูลระหว่างกัน ชุดผลลัพธ์และข้อความที่เกี่ยวข้องจะถูกส่งกลับมายังขั้นตอนการดำเนินการ เพื่อที่ผู้ใช้จะสามารถดำเนินการในลำดับต่อไป
- ข้อมูลสามารถถูกจัดเก็บในรูปของบล็อกข้อมูลและสามารถทำการโหลดใช้งานได้จากหน่วยความจำทุกเมื่อที่คุณต้องการ หากตารางต่าง ๆ มีขนาดใหญ่เกินกว่าปริมาณหน่วยความจำที่บรรจุได้ เซิร์ฟเวอร์จะทำการเก็บบล็อกข้อมูลต่าง ๆ ไว้ในรูปแบบของแคช (cache) แทน เก็บข้อมูลและผลลัพธ์ขั้นกลางไว้ในหน่วยความจำได้นานเท่าที่คุณต้องการ สำหรับหลากหลายส่วนงานและขอบเขตของผู้ใช้
- อัลกอริทึมจะกำหนดจำนวน node ที่เหมาะสมที่สุดสำหรับงานแต่ละชิ้น
- ชุดระบบการสื่อสารที่มีประสิทธิภาพช่วยรองรับในกรณีที่เกิดความผิดพลาดและช่วยให้คุณสามารถลบหรือเพิ่ม node ข้อมูลในเซิร์ฟเวอร์ได้แม้ในขณะที่กำลังดำเนินงาน องค์ประกอบทุกส่วนในงานของคุณสามารถทำซ้ำเพิ่มได้ในอนาคต เพื่อเพิ่มศักยภาพการทำงานของคุณ
- ผลิตภัณฑ์ของเราสามารถใช้งานได้ในโหมดสำหรับผู้ใช้หลายราย เพื่อให้ซอฟท์แวร์ส่วนรวมที่คุณมีสามารถใช้งานได้สำหรับผู้ใช้ที่แยกกลุ่มไว้โดยเฉพาะ