聚类分析
聚类分析是根据研究对象的特征对研究 对象进行分类的多元分析技术。如市场 营销学中进行市场分层、确定目标市场 等等都需要对研究对象进行分类。即把 性质相近的个体归于一类,使得同一类 的个体具有高度的同质性。聚类分析的 大部分应用都属于探测性研究。与鉴别 分析的区别在于没有事先规定的标准。
如果数据生成过程不是完全先验已知的, 这相应于独立投掷一个各面都标有数字 {1,2,3,4,5,6}的六面体,与上面 情形不同之处在于我们不知道六面体是 否具有标准均质的结构。在这种情形下 常规做法是做大量独立试验对未知的概 率特征进行推断。应用工具为数理统计 学中的估计理论。
建模理论及应用
如果我们只知道试验结果来自掷一个各面都标 有数字的多面体,我们需要根据试验结果推断 出数字{6}的概率分布结构。根据已知信息要 解决这个问题是相当困难的,这是因为我们面 临多种可能性,如多面体不是通常的六面体、 标有数字6的面可能不止一个,多面体可能不 是均质的,投掷方法不是独立的等等。据试验 结果对上述可能性择取决断,属于不同模型枷 说的择取问题。这类建模问题才是实际中最常 碰到的问题。
Logistic回归和logit模型
当因变量为二分类变量且自变量为测量 型变量和虚拟变量时,不能采用多元回 归,而应该使用logistic回归。Logit 模型 是对数线性模型的一种特例。它不同于 logistic回归之处在于其自变量全部是分 类变量。
鉴别分析
鉴别分析是一种进行统计鉴别和分组的 技术手段。它可以就一定数量案例的一 个分组变量和相应的其他多元变量的已 知信息,确定分组与其它多元变量之间 的数量关系,建立鉴别函数。然后便可 以用这一数量关系对其他已知多元变量 信息、但未知分组类型所属的案例进行 鉴别分组。