融360信用卡(信用卡业务员一个月60张难吗)
- 时间:
- 浏览:68
- 来源:奥一装修网
融360信用卡申请成功率
数据来源:荣用户贷款风险预测参考资料:过程如下:1.项目目标是根据组织者提供的用户基本信息,消费行为和还款状态,建立准确的逾期预测模型。用户将逾期贷款。 。 2.可以在方荣关的在线搜索数据概述中组织有关数据解释的相关技术术语:用户的基本属性,银行记录,用户浏览行为,信用卡账单记录以及贷款时间记录的逾期行为(注意:并非每个用户都有非常完整的记录,例如某些用户没有信用卡帐单记录,而某些用户没有银行记录,同时应注意,数据已被脱敏:用户信息被隐藏;所有用户属性信息已数字化;时间戳和所有金额功能值已转换。)数据详细说明:用户的基本属性。总共有字段,其中字段性别表示性别未知。用户性别职业教育程度婚姻状况账户类型银行运行记录。总共有字段,其中第一个字段是时间戳,表示时间未知。在第一个字段中,交易类型具有两个值,分别代表支出和收入。第一个字段,当工资收入标记为时,表示工资收入。用户时间戳交易类型交易金额工资收入标签用户浏览行为。共有字段。其中,第一个字段时间戳指示时间未知。用户时间戳浏览行为数据浏览子操作号信用卡帐单记录。总共有字段,其中第一个字段是时间戳,表示时间未知。为了便于浏览,这些字段以表格的形式给出。文件示例如下:用户账单时间戳银行最后一次账单金额最后还款金额信用额度限制当前账单余额当前账单最低还款金额消费当前账单金额调整金额循环利息可用金额预贷现金金额还款状态上期金额要求在上个月还清信用卡的账单。上次还款的金额:用户上个月已还款的金额。信用额度:信用额度(即信用卡透支的最高额度)。信用卡金额。当前账单余额:指自开票之日起当期的账单金额。
但是,当金额低于当前还款金额时,银行将为延迟付款的剩余金额计算相应的利息。可用余额:已使用的未付款额度。累计金额尚未记入。提前现金量:是指持卡人使用信用卡通过自助终端提取现金的最高还款状态:未付,已还款时间信息。总共有字段,用户和借阅时间。用户在银行发放贷款时借出记录客户是否有逾期行为的时间。共有字段。样本标签是逾期超过几天;样本标签是少于到期天数的标签。注意:逾期未交的用户不在此问题范围内。对于测试用户,仅提供一个列表,即文件名。用户样本标签在这里可以理解为过期或不过期。 3.数据预处理导入数据,检查丢失的数据,计算用户数,查看丢失的值:不丢失,然后查看用户:一个用户有银行记录。以相同的方式,导入其他表信息:查看一个表中的用户数量:每个表的数量都不同,这表明并非每个用户都具有银行卡流量,票据等信息;因此下一步是集成表,然后基于共享用户匹配完整信息而不删除完整信息。注意:我们要预测的测试集是没有贷款的客户,因此训练集会分析客户贷款之前的信息,将时限表与贷款表交叉,仅在贷款之前过滤客户的信息。通过上表贷款。您可以看到,除了贷款时间表之外,还有其他时间字段是银行流量记录表,账单记录表和浏览信息表。表示流记录时间,指示支付时间:重复数据消除的客户数量:客户也以其他形式进行了相同操作:结论是用户的记录已完成。然后使用它来过滤每个表的记录并执行字段预处理。数据预处理:银行流量表:收入,支出和薪水排序:收入和支出与用户表分别交叉(仅过滤完整用户的信息):将收入和支出薪水集成到表中(请注意,这是左侧链接) )浏览表:首先删除数据,然后计算每个用户的浏览记录以计算浏览次数:计费表:删除时间,银行和还款状态的变量,并按用户分组以平均每个字段处理过期表格,
与逾期行为有关的因素包括:性别,年龄,受教育程度,婚姻状况,收入,用户是否有贷款,汽车贷款和其他经济状况。在案例数据中,我们首先可以过滤出:性别,受教育程度,婚姻状况。 (职业和账户类型这两个特征可以反映用户的收入,但不确定性很大,因此,不考虑筛选,就可以从用户在银行的收支记录中反映用户的经济状况)。一步筛选的特征是:让我们看一下这些功能的相关性:银行自来水:可以看出收入,支出和工资的金额与笔的数量成线性关系,然后稍后将构造一个新功能:平均金额笔数和平均工资;而且,收入和支出密切相关,因此只能取一个,而且支出是平均的。票据:从图中可以看出,两者之间的高度相关性的特征是:前一张票据的金额,前一次还款的金额,当前票据的金额以及当期余额账单和当前期间的最低还款额。 。注:本期应偿还金额,上期票据金额,上期还款金额,本期票据金额,本期调整金额,周期利息,公式表示:上次还款额,上一次汇票的最低还款额(通常为汇票金额)或不还款,被视为逾期,当期还款应加上经常性利息和部分之前未偿还的期间。上期的最低还款额上期的还款额不算逾期,但本期的还款必须加上上期的经常性利息还款额,即上期的账单金额,即也就是说,如果有更多的用户,则将本期的还款额从调整金额(多付的部分)中减去,并且不计算流通利息。因此,前期的票据金额与还款额密切相关,相关系数也高。可以引入一个新功能:以前的还款额和以前的还款额之间的差额。以前的还款差额也直接影响用户的信用额度和当期的账单金额。当前的帐单余额和最低还款额是高度共线的,因此决定仅使用最低还款额。此外,调整金额和经常性利息与“上期还款差额”有关:还款差额需要计算经常性利息,调整额不计算还款差额,需要计算调整额,并且不计入经常性利息,因此可以通过“特征二值化”来执行还款差额以替换这两个特征。
因此,可用余额与信用卡限额,以前的还款差额和经常性利息有一定的关系。但是,令我惊讶的是没有显示相关系数图,因此我暂时不会过滤此功能。预贷款现金限额是指持卡人可用于通过自助终端提取现金的最大现金额。现金提取限额包含在信用额度中,通常在信用额度附近,因此您可以选择信用额度而无需使用此功能。说了这么多,现在就可以过滤出我们想要的信用卡记录的特征:(上一次还款之间的差额)。最后,我们展示了基于业务理解的特征选择结果:重建数据表:基于机器学习筛选,仍然根据业务理解过滤了许多特征,因此我们仍然需要使用机器学习方法来进一步减少特征。在筛选之前,我们将此特征视为“二值化”:特征是分类变量,其他特征是连续数值变量。我们采用两种特征选择方法:方法和方法选择:选择的结果是:方法:选择的结果是:发现两种方法的结果有很大不同。该方法没有选择任何子类型变量,并且将选择的方法“”和“”分为两种类型的变量,并且相同的是选择了总和。哪种方法可行:“”“”“”“”“”“”“”“”方法的结果是:“”“”“”“”“”“”“”“”方法的结果是:交叉测试表明用法更好(越小越好),下一步是建模由于所选要素同时具有子类型和连续类型,因此请使用决策树。
设置决策树参数和建模。此处使用决策树中的方法。之所以不使用它们,是因为这两种方法无法处理连续数据,必须将其转换为离散数据。
融360信用卡邮箱
“用于划分属性,基尼系数,信息增益的选择标准在节点中选择的分类策略(最佳)树的最大深度与内部节点不同的最小样本数必需叶节点所需的最少样本数对模型结果的评估查看模型结果分析报告:准确率,召回率,是的,仍然可以对模型进行综合评估,接下来,您可以进行调整模型的参数,这里我主要是对树的深度进行不同的设置,发现树的深度越大,模型的结果越好,此外,决策树的最大问题是我在Internet上看到的解决方案主要有两种:修剪树,包括使用随机森林方法进行的修剪前和修剪后树;随机样本选择和随机属性选择