Rosetta是由挪威科技大学计算机与信息科学系和波兰华沙大学数学研究所合作开发的一个基于Rough集理论框架的表格逻辑数据分析工具包,包括了计算核和图形用户界面,能够在微机的WindowsNT/98/95操作系统上运行。
Rosetta 的设计实现了对数据挖掘和知识获取的支持从数据的初始浏览和预处理,计算最小属性约简和产生if-then决策规则或描述模式,到对所得到的规则或模式的验证和分析。Rosetta的目的是要作为基于不可分辨关系模型的通用工具,而不是为某个特定的应用领域设计的专用系统。
Rosetta提供了一个很直观的图形用户接口,采用了数据导航的技术。图形用户界面是高度面向对象的,所有操作对象被表示为独立的图形用户界面的元素项,每个元素有自己的与上下为相关的菜单集合。
Rosetta 的计算核心也可以采用命令行程序。计算核心提供了如下的功能:
输入/输出
通过ODBC和DBMSs部分集成
输出格式包括规则、约简、表格、图像以及C++和Prolog等格式。
预处理
不完备数据表的完备化处理(数据补齐)
连续属性值的离散化
计算
支持有教师学习和无教师学习
支持用户自己定义的不可分辨关系概念
对不同类型的不可分辨关系有效地计算精确约简和近似约简
产生if-then规则或以约简形式表达的描述模式
执行文件
支持交叉沿着测试
后处理
过滤约简结果和所得到的规则
验证与分析
用得到的规则处理未知样本
产生混淆矩阵、ROC曲线和标度曲线
用一定的质量标准对规则进行评价
统计假设测试
其他
公差关系聚类
计算划分和可变精度Rough集近似
支持对观察的随机抽样。
Rosetta在上述的功能中提供了很多可选的算法,是一个很好的研究试验平台。 |