基于支持向量机的信用评级研究

 2021-12-08 05:12

论文总字数:27902字

摘 要

世界经济不断发展,全球范围内的合作不断加强,在此大背景之下,信用风险也乘势不断增长,而一个科学可靠的信用评级方法可以有效降低信用风险,从而规范市场,建造一个健康的经济环境。近年来,信用评级的研究也得到了越来越多的关注,尤其是近几年互联网金融的兴起。机器学习在信用评级研究中的应用越来越广泛,相对于传统的统计方法来说,基于小样本统计学习理论的支持向量机方法在信用评级中有更好的泛化推广能力。本文先对信用评级和支持向量机方法相关理论进行分析研究,然后将SVM方法运用到信用评级之中,提出符合我国国情的个人信用评级体系指标,在实证部分,以个人信用评级为例,将支持向量机方法和简单聚类方法进行比较,进一步说明此方法的可行性。

关键字:信用评级 支持向量机 个人信用评级体系

Credit rating study based on support vector machine

Abstract:

With the development of word’s economy, the global cooperation continues to strengthen.And under this background,credit risk is also growing.So a suitable rating method is one of the reliable ways of reducing the credit risk.Recently,credit rating has received more and more attention,especially,the rise of Internet in recent years,credit rating research is getting a wide range of attention.Compared with the traditional statistical method,the machine learning in the credit rating is becoming increasingly widespread.And the Support Vector Machine based on small sample statistical learning theory has better generalization ability in credit rating.This paper studies the credit rating problem with the Support Vector Machine method.Take the personal credit rating as an example,and propose the personal credit rating system index,through the empirical analysis, and compared with simple clustering method in order to prove the feasibility of SVM.

Key words:credit rating, support vector machine(SVM), index system of personal credit rating

目录

摘要 1

第一章 引言 3

1.1研究背景和意义 3

1.2国内外研究现状 4

1.2.1国外研究现状 4

1.2.2.国内研究现状 5

1.3本文的主要内容与结构 5

第二章 信用评级概述 7

2.1信用评级的相关概念 7

2.1.1信用评级定义 7

2.1.2信用评级原则 7

2.1.4信用评级作用 8

2.2信用评级发展的理论基础与实践 9

2.2.1理论基础 9

2.2.2实践与发展 10

第三章 支持向量机主要原理 11

3.1统计学习理论 11

3.1.1VC维 11

3.1.2结构风险最小化 11

3.2支持向量机理论 12

3.2.1支持向量机基本原理和最优分类面 12

3.2.2线性可分支持向量机 12

3.2.3非线性支持向量机 15

第四章 个人信用评级体系构建 17

4.1指标体系的选取原则 17

4.2个人信用评级的指标体系构建 17

4.2.1国内外个人信用评级的指标体系 17

4.2.2适合我国个人信用评级指标的探讨 18

第五章 实证分析 20

5.1数据来源与样本选取 20

5.2数据处理和抽样 22

5.3实证结果 23

第六章 总结 24

致谢 26

参考文献: 27

第一章 引言

1.1研究背景和意义

随着世界经济的不断发展壮大,经济全球化、金融全球化特征日益明显,特别是最近几年互联网金融的兴起。在这样的大背景下,信用环境不断趋紧,不管是作为个人还是作为企业在面对机遇的同时也面临着更多的信用风险,可以说发展机遇和信用风险同比增长,让人不得不防。相信大家一定对2008年美国的金融危机不陌生,而导致此次危机爆发的根源便是次级按揭贷款,即给资信条件较“次”的人的按揭贷款,之所以“次”是因为信用比较低,所以申请不到优惠的贷款,不得不转换方向另求他法,在次级市场上寻求贷款。由于美国金融监管部门的缺失,次级按揭贷款大幅增加,最终使得潜在的还款风险转变为了现实风险,从此一发而不可收,到了引发危机的程度,严重影响了经济的发展。由此可见,信用问题万万不可小觑,如果相关部门没有及时采取监管措施,任其自由随意发展,信用问题将会酿成大错,严重阻碍全球经济的健康发展,带来毁灭性的伤害。诚然,信用问题已成为一个迫在眉睫,急需解决的问题。

而信用评级业的存在在一定程度上可以有效控制信用风险,为社会大众提供一个健康发展的市场经济。科学的信用评级服务机构可以为客户、为企业提供切实可行的评级服务,有效维护经济秩序,从而促进金融市场良性发展。近年来,信用评级也成为学术领内争相研究的对象,不同的评级方法、评级模型也如雨后春笋般不断涌现。切实可行的信用评级不仅是对某些投资机构有用处,对所评级的对象也有利。对投资机构来说,可以降低对某投资对象的进行信用分析的成本,还可以在最短时间内做出决策,节省了大量的人力、物力、财力和精力。对评级对象而言,可以真实、直观的了解到自身的优势和存在的不足,对于不足做出调整和改变。

近年来,支持向量机(Support Vector Machine,SVM)方法大放光彩,和别的方法相比,具有良好的推广性能和较好的分类准确性,因此也已成为机器学习领域专家学者们争相研究的新对象。最先被贝尔实验室运用在美国邮政手写数字库识别的探索之中,经过不断的努力最终获得了较好的结果。由于有这一个成功案例,之后便被越来越多地各个领域的学者所青睐。比如检测恶意软件、识别加密算法等计算机安全领域的应用,人脸检测、验证和识别方面的应用,文本分类、图像处理方面的应用,在金融方面也有较多的应用,比如对中小企业信用评级研究、对个人信用评级的研究。近年来,国内外众多学者对此都非常重视,将支持向量机方法引入到信用评级研究中是非常具有现实意义和经济意义的。

1.2国内外研究现状

1.2.1国外研究现状

信用评级最初产生于20世纪初期的美国,在国外的发展历史较为悠久,从技术层面、研究深度方面来说也相对较为成熟。当时,由于工业化的迅速发展,进一步带动了经济的迅速增长,很多公司也逐渐开始在资本市场上发行债券。然而对于这些债券,并没有一个统一的标准或统一的规范来证明其是否存在信用风险,这使得投资者们很难抉择。因此,约翰穆迪先生建立了穆迪评级公司,率先开始评价当时发行的铁路债券,评级结果受到了投资者的一致好评。慢慢地,评级行业就渐渐发展壮大起来。后来市场需求不断扩大,市场上出现的产品种类也不断增多,继而评级对象也延伸到了更大的范围,比如金融产品、金融工具等。早期的信用评级方法多为定性分析,而在进入20世纪60年代以后,定量分析的方法开始崭露头角逐渐广泛地进入到信用评级之中,其具体内容也在一步步充实,具体方法也在不断地改进。早期,杜兰德(1941)最早把线性判别分析方法,运用到信用评估之中,之后埃森柏斯又将此方法推广。阿特曼(1968)教授把多变量的传统方法为基础,对多个财务比率进行数理统计筛选后建立Z-score模型,用来预测企业破产的概率。最开始是奥尔森(1980)将Logit回归分析用来建立预测模型并应用于信用评级领域。马达洛(1983)使用分离样本的Logistic判别模型以区分贷款申请人的信用状况。祖米卓斯基(1984)把Probit模型用于对公司样本的财务困境的预测上面。随着人工神经网络的兴起,奥多姆和沙尔达(1990)将神经网络模型应用于信用评级中;90年代后,金融机构资产多样化,信用风险管理变得越加复杂起来,更多用于信用评级的模型开始出现并兴盛起。摩根银行(1997)和其余几个银行共同研究出了以资产组合理论、VAR理论为基础的评估信用风险的模型Credit-Metrics。万普尼克在90年代最早提出支持向量机方法,在1995年和他的研究小组针对手写阿拉伯数字的识别问题构造了多类问题支持向量机。斯密茨(2002)从核函数这一方向出发,根据每种核函数具有各自的特点这一特征组合SVM中的核函数,结果表明混合式核函数的泛化能力与学习能力比单一核函数更好。陈炘钧讲授(2004)等人利用SVM方法与BP神经网络方法对台湾和美国两个市场上的数据进行研究分析,并将结果进行比较,表明SVM方法有更高的预测准确率,更加优于神经网络方法的。李和明(2005)利用交叉验证方法找出了SVM方法核函数中的最优参数值,实验结果表明与Logit和BP神经网络模型相比,SVM方法的预测准确率更高。乔纳森克鲁克(2009)等人经过分析大量的数据之后发现信用风险评估中可以运用SVM方法。吉玛(2012)等人提出可以运用到债券评级的新型分类器——MSVM分类器,实证结果表明与常规方法相比较,这个分类器的分类性能更好。

1.2.2.国内研究现状

由于我国早期信用制度不完善,信用意识比较薄弱等诸多原因,在加上建国初期基本也没有什么消费信用,后来随着社会经济体制的改革以及金融的逐步开放,才普遍意识到想要有一个健康良性的、经营稳健的经济环境以及风险的防范是多么重要,所以直到20世纪80年代末,我国才开始研究信用评级的相关问题。因此,与国际上的信用评级水平来比较,我国的信用评级不管是研究方法还是评级体系、评级意识等方面都存在欠缺的地方。起初,我国信用评级行业是用来服务于企业发行债券和银行发放贷款的,但随着经济的不断发展壮大,各个领域、各个行业不断兴盛起来并逐渐发展,信用评级行业的范围和规模随之也不断扩大,渐渐地融入了激烈的市场竞争之中,评级的服务对象也并不仅仅限于此。在信用评级的研究方法方面,我国专家学者在国外专家学者研究成果的基础上, 结合中国国情不断探索发现,也取得不错的成果。吴冲锋和程鹏(2002)把所选取的上市公司分为三类,运用KMV模型对其进行信用评级。肖北溟(2004)为创造国有银行的内部信用评级模型采用了因子分析和聚类分析等方法。随后方洪全(2004)等人开始考虑到不同行业企业又不同的特点,对风险评级的影响也不同,由此提出使用联机分析挖掘的方法。深翠华(2004)等人把支持向量机方法运用到了个人信用评级当中。林成德(2005)等人在预测上市公司的财务危机问题上运用了支持向量机方法,实证结果证明此方法的预测准确率比较高。陈涛(2006)等人在外贸公司的客户分类之中也使用了SVM方法,得到较好的效果。肖文兵(2007)等人使用SVM方法创建信用评级模型,并且用来评价风险以获得更好的预测结果,同时为保证准确性又运用交叉验证的方法来深入验证支持向量机的分类准确性。张目(2010)建造了基于多目标规划的SVM模型预测企业信用评级,实证结果表明预测准确率比较高。姚潇(2012)等人在使用近似支持向量机基础之上,将模糊思想引进,进而提出模糊近似支持向量机模型,为了检验该种模型的有效性,在此基础上还运用逻辑回归方法、神经网络方法等方法对信用数据进行实证结果的对比,事实证明模糊近似SVM模型的预测精度更高,泛化能力也更好。

1.3本文的主要内容与结构

本文主要介绍一下信用评级的相关内容,支持向量机的一些原理方法以及个人信用指标体系的构建,实证方面以个人信用评级为例,运用支持向量机的方法进行分析。

本文依据描述研究现状,给出基础理论,开展实证研究,由浅入深展开研究分析。具体分为引言、信用评级概述、支持向量机主要原理、个人信用评级指标体系的构建、实证分析、总结等六个章节来叙述。第一章引言,简述了选题背景及意义,也通过研读国内外文献,了解国内外众学者对信用评级和支持向量机的相关研究现状和研究方法,同时也指出本文要研究的内容以及结构。第二章信用评级概述,讲述信用评级的定义、原则、作用和相关的一些理论与实践,进一步深入、具体地了解信用评级。第三章支持向量机主要原理,讲述一下相关统计学习理论的内容、最优分类面以及线性支持向量机和非线性支持向量机以及非线性中使用的核函数。第四章个人信用评级指标体系的构建,因为文章的实证分析基于个人信用评级展开,所以简要介绍下国内外个人信用体系指标,并且根据已有相关文献资料,提出符合我国事实需求的客观的有建设性建议的个人信用评级指标体系。第五章实证分析,以个人信用评级为例,主要讲述本文实证的数据来源,介绍所用数据的意义,与简单聚类方法进行比较,然后分析实证结果。第六章总结,归纳本文的主要内容,分析研究过程中存在的不足以及在大数据时代下做出信用评级研究的展望。

第二章 信用评级概述

2.1信用评级的相关概念

2.1.1信用评级定义

国内外各大评级机构对信用评级的定义在大致方向是都是一致的。信用评级是指由独立的信用评级机构对影响评级对象的诸多信用风险因素进行分析研究,根据其偿还债务的能力以及其偿还债务的意愿进行综合评价,并且最终使用简明易懂的符号标示出来。在社会活动中,只要发生经济活动,就会有信用风险的存在,就会存在不能履约或者无法履约的可能性。这时,针对这种不确定性,事先对借债对象的偿债能力和偿债意愿进行综合评价就显得很有必要。评级可以提供一个保障,尽最大可能避免不必要的风险。美国《银行和金融大百科全书》中也有对信用评级定义的定义:“信用评级是以一套相关指标体系为考量基础,标示出个人和经济体偿付其债务能力(偿债历史记录)和意愿的值。”此定义中除了考虑到债务人偿债能力和偿债意愿之外,还涉及了相关指标体系的建立,不管是对个人信用进行评级还是对企业信用进行评级,一套行之有效的评级体系是至关重要的,会直接影响最终的评级结果。

基于各大评级机构以及查阅的一些资料,从本文来看,所谓信用评级,就是由一些专门的评级机构通过各种有效的途径搜集相关信息,根据一套行之有效的评级指标体系,使用科学化的方法,专业化的知识,规范化的操作对评级对象的信用风险给出客观的评价,然后再通过字母序列符号对评级对象进行综合评价后的直观的结果展示,最终将结果告之于社会。

2.1.2信用评级原则

(1)真实性原则。从评级开始到评级结束,这之间的每一个过程,都要确保所使用的评级对象的资料是真实而准确的,这样所做的评级工作才有意义,真实性是评级工作的最基本原则。

剩余内容已隐藏,请支付后下载全文,论文总字数:27902字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;