论文总字数:27937字
摘 要
传统的征信业务虽然已经经历了漫长的发展过程,但是随着技术的进步和时间的推移,这种征信方式的弊端和缺陷也不断显现出来,特别是在互联网的冲击下。现有的征信模式存在征信体系不健全,缺乏广泛统一的社会征信模型和评分标准,各征信平台之间信息不共享,缺乏针对性的信息安全和隐私保护制度等问题。本文的研究目的是确定新型大数据征信的信用指标体系,并利用Logistic回归去分析其与信用的关系。通过研究占有率高的互联网应用的功能,得到其可以精确定位个人的有效数据,再结合传统的信用指标,构造新的指标体系。问卷收集数据,利用不同的回归分析方法来确定最终的影响模型。我们最后得到性别、信用卡数量、月均网购次数、月均网购消费金额、月均订外卖次数、在线教育月均付费、是否拥有车辆、社交账户总好友数、在线教育月均学习时长与芝麻信用等级的相关度更高。
关键词:大数据征信,Logistic回归,信用指标体系
Abstract
Although traditional credit information services have undergone a long period of development,but with the progress of technology and the passage of time,the drawbacks and shortcomings of this kind of credit information are constantly emerging under the impact of the Internet.The existing credit information model has an imperfect credit system, lacking a broad and unified social credit model and scoring standards,information sharing among credit information platforms,and targeted information security and privacy protection systems.The purpose of the paper is to determine the new credit index system of big data credit, and use Logistic regression to analyze its relationship with credit.By studying the function of high-occupation Internet applications, it is possible to accurately valid data locating personal .Then combining traditional credit indicators, we can construct a new index system.Collect data by questionnaires and use different regression analysis methods to determine the final impact model.We find that the gender, number of credit cards, number of monthly average online purchases, monthly average amount of online shopping spending, monthly average number of takeaways, monthly payments for online education, total ownership of vehicles, number of social account friends, monthly average length of online education have a high degree of Sesame Credit.
KEY WORDS:big data credit,Logistic regression,Credit indicator system
目录
摘要 I
Abstract 2
第一章 绪论 1
1.1 研究背景 1
1.2 研究意义 1
1.3 国内外研究现状 2
1.4 本文主要研究内容及研究方法 3
第二章 互联网行为和信用评估模型概述及选取 5
2.1 用户互联网行为分析 5
2.1.1 互联网用户行为类别 5
2.1.2 互联网用户行为特征 6
2.2 传统的个人信用评估 7
2.3个人信用评估分类 7
2.4 主要信用评估方法介绍 7
2.4.1 判别分析法 7
2.4.2 Logistic回归分析法 8
2.4.3 K-近邻分析法 8
2.4.4 朴素贝叶斯分类 8
2.4.5 决策树方法 9
2.4.6 人工神经网络模型 9
2.5 基于用户互联网行为的个人信用评估模型的选取 9
第三章 基于用户互联网行为的信用评估模型的指标体系的建立 10
3.1 指标体系选取依据 10
3.2 理论基础 10
3.2.1社会资本理论 10
3.2.2 基于“5C理论”的模型 10
3.3 指标选取逻辑——互联网数据导向指标 11
3.4结合“5C理论”、互联网行为数据的指标体系 16
3.4.5因变量的选择 17
第四章 基于用户互联网行为的个人信用评估 18
4.1 指标的量化 18
4.2 数据来源 18
4.3 自变量之间的多重共线性检验 18
4.4 直接logistic回归结果分析 19
4.4.1模型总体评价 20
4.4.2模型预测能力分析 20
4.4.3模型中的自变量分析 21
4.5 因子分析 21
4.6 回归分析 24
4.7 研究结论 25
第五章 总结和展望 27
5.1总结 27
5.2展望 27
致谢 28
参考文献 30
第一章 绪论
1.1 研究背景
(1)政策支持:国家对于个人信用评估越来越重视,出台很多相应的政策支持。自2013年起,我国就颁布了一系列的法律法规,为个人信用评估行业的健康发展构建了法律制度框架。为了加快大数据征信的部署,推动“互联网 ”。
(2)需求支持:互联网金融行业发展迅速,为大数据征信提供了大量的潜在需求。国内良好的网络外部环境和传统金融的乏力都促进了互联网金融的飞速发展。以P2P借贷、众筹、在线支付、网上银行等商业模式为代表的互联网金融的发展,解决了传统金融服务的不便捷、服务范围窄等问题,服务了更多对金融有需求的人。
(3)应用支持:传统的个人信用评估模型不再适用。传统的个人信用评估模型是基于FICO模型,从5个方面分析个人的信用风险:品行,能力,资本,抵押,条件。我国当下的主要个人信用评估主要应用于贷款等银行业务,而评估的标准就是查询央行的征信系统还有在本银行的业务、抵押物价值。但是互联网金融的发展,导致传统金融业务也不断拓宽,贷款等金融业务不再局限于有抵押物的资产状况良好的中年人,更多的变成面向年轻人的小额贷款、分期需求。由于年轻人没有过多的资产、抵押物及流水,假如使用传统的信用评估模型,年轻人就很难在新型金融模式中收益,这明显不符合发展互联网金融的初衷。
剩余内容已隐藏,请支付后下载全文,论文总字数:27937字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;