SAS® 文本挖掘
文本挖掘软件,用于从非结构化数据中更快地获得更深入的洞察。
我们的文本挖掘软件可让您轻松分析来自 Web、评论字段、书籍和其他文本源的文本数据。所以,为什么要仅限于分析原有数据呢?通过发现新信息、主题和词汇关系来加深您的理解,并将所学知识添加到模型中,以改善提升和性能。
优势
改善模型性能。
预测模型使用情景知识来描述未来场景。但是,评论字段、注释、报告、查询、网络评论等中描述的重要情况和事件并未捕获在易于分析的结构化字段中。使用我们的文本挖掘软件,您可将来自基于文本的源的洞察添加到模型中,以获得更高的预测能力。
添加主题专业知识。
通过使用交互式的 GUI 轻松地确定相关性,修改算法、记录分配并将材料分组为有意义的聚合,从而指导机器学习结果。通过使用自定义实体和词汇趋势发现来完善自动生成的规则和主题,将文本挖掘扩展到基本的起止列表之外。
自动了解更多。
使用机器学习和自然语言处理技术,自动化耗时的人工活动,如主题提取或关键词汇关系。高性能程序可让您在几分钟或几秒钟内运行评估(即使是大型集合),从而快速发现可改善模型提升的基本要素。
确定热门和非热门。
文本构造为总结文档集合的数字表示,并为预测和数据挖掘建模技术提供输入。使用与 SAS 企业级挖掘相同的可视化环境,您可以轻松地检查关键主题、识别高度相关的短语并观察词汇随时间的变化,从而得知应包含哪些内容以获得更好的结果。
截图
功能
- 高性能文本挖掘。 使用高性能文本挖掘程序快速评估较大的文档集合。
- 灵活的人性化界面。 文本数据处理接口符合 Windows 辅助功能标准。
- 自动布尔规则生成。轻松分类内容。
- 词汇分析和趋势研究。 评估集合中词汇的相关性并了解随时间变化的使用趋势。
- 记录主题发现。 使用集成式文档过滤功能确定文档集合中的主题。
- 结果的可视化查询。 可视化地分析结果、轻松地探索词汇之间的关系并传达结果。
- 灵活的实体选项。选择预定义实体、定义自己的实体或创建用于事实和事件提取的自定义实体。
- 轻松导入文本。使用交互式界面轻松导入任何文本文档。
- 本地支持多种语言。 根据预定义的输入变量选择要包含的语言。