2022 年 2 月 17 日 一种以一组节点(如树)的形式思考/制定决策的方式,可以为多个操作选项提供答案。通常一棵决策树从一个节点或一个顶点开始。然后节点分支以提供其他操作选项。接下来,该节点将有新的分支。
新节点或分支的创建将继续重复
直到满足停止标准。决策树通常可以处理包含名义或数字属性的数据集。属性标签对于分类过 越南 WhatsApp 号码数据 程必须是名义的,对于回归过程必须是数字的。 为了进一步了解决策树算法,下面我们将解释决策树算法中可以配置哪些参数: 标准:单独属性的参数。
对于每个可以选择的准则,它必须能够优化决策树的分裂值。以下是可以选择的几个标准: Information_gain:该准则计算所有属性的熵,选择熵值最小的属性进行分裂。
该标准偏向于选择具有大量值的属性
Gain_ratio:此标准调整每个属性的信息以允许属性广度和均匀性。Gini_index :该标准衡 B2B 传真线索 量标签特征分布之间的不平等程度。对所选属性进行拆分会导致结果子集的平均基尼指数降低 准确性:该标准选择能够最大化整棵树准确性的待分离属性。
Least_square :此标准选择要分割的属性,它最小化节点中平均值相对于实际值之间的平方距离 Maximal_depth :该参数用于限制决策树的深度。