数据仓库是适合知识发现的过程的结构。数据仓库的处理过程是从“数据清理/整合——>数据仓库——>数据选择——>数据挖掘——>模式评价——>知识”不断循环的过程(注:类似Fayyad 96年提出的数据挖掘过程模型)。
将数据仓库和挖掘的结构划分为四个层次:第一层是数据层,第二层是多维数据库层MDDB,第三层是OLAP和OLAM,第四层是用户界面。(注:类似Han Jiawei的OLAM体系结构)
数据挖掘过程包括:数据选择,数据转换,数据挖掘,数据解释
数据挖掘的方法:联想,划分,聚类,预测,顺序模式,相似时间序列。
数据挖掘的科学方法数学工具:统计学,决策树,神经网络,模糊逻辑,线性规划。
个人信用评分系统是将个人信用的历史(六个月以上)经过45至65个因素的刻划后表述的决策模型。通常个人信用评分为350至850之间。每人从850分起,有坏帐记录,即扣去不同比例的分数。经过评分模型的分析,最后得到决策评分。(850为最好)
评分因素:过去的付帐历史、信用欠帐量、信用卡使用时间、新信用卡的申请、信用卡的类、信用卡交易情况、现金提取情
应用前景:银行各类信贷风险分析,企业和个人信用风险分析 |