机器学习方法在心理特征分析中的应用

 2022-08-06 10:15:35

论文总字数:36199字

摘 要

现如今,中国各地高校因学生心理因素导致的各种问题层出不穷,引起了社会各界广泛的关注和重视。如果在问题发生前提早对学生进行关注并进行适当的心理干预,能极大地减小问题发生的可能性,降低危害,维持校园和社会稳定。目前已有部分研究人员将机器学习的方法用于心理学研究,但更多强调其解释性而非其预测的精确性。

本文使用某个心理机构提供的高校学生心理数据,研究机器学习方法在心理特征分析中的应用,构建了一个基于机器学习的心理预测系统。在构建过程中分别采用决策树算法,支持向量机算法和BP神经网络算法构建心理预测模型,并使用Adaboost算法,Bagging算法和随机森林算法对构建的模型进行集成得到集成模型。针对心理数据集样本数据不均衡的问题,提出了解决方案并通过实验验证其效果。构建得到的心理预测系统证明了机器学习方法应用于心理特征分析的合理性和有效性,具有实际的应用价值。

考虑到心理学数据的保密需求,本文提出将人工合成数据的方法应用于心理学预测问题,实现充分利用数据价值的同时防止隐私泄露。本文首先介绍并实现了SMOTE算法,并对SMOTE算法做出改进,提出了针对二分类问题,基于不均衡数据集进行人工数据合成的SDBID算法。实验表明本文提出的SDBID算法性能略优于SMOTE算法,人工合成数据的方法应用于构建心理预测系统切实可行,能够在基本不影响预测效果的情况下有效避免隐私的泄露。

关键词:心理预测,机器学习,集成学习,人工合成数据

Abstract

Nowadays, various problems caused by psychological factors in Colleges and universities in China emerge frequently, which has aroused wide attention from all sectors of society. If we can pay attention to the students who have psychological problems before the occurrence of the problem and carry out appropriate psychological intervention, it can greatly reduce the possibility and harm of the problem, and maintain the stability of the campus and the society. At present, some researchers have used machine learning methods in psychological research, but more emphasis is put on their explanatory rather than the accuracy of their predictions.

In this paper, in order to study the application of machine learning method in the analysis of psychological characteristics, a psychological prediction system based on machine learning is constructed by using the psychological data of a university student provided by a psychological institution. The decision tree algorithm, the support vector machine algorithm and the BP neural network algorithm are used to construct the base model respectively, and the Adaboost algorithm, the Bagging algorithm and the random forest algorithm are used to integrate the base model to get the integrated model. Aiming at the problem of imbalanced mental dataset, we propose solutions and verify their effectiveness through experiments. The psychological prediction system proves the rationality and effectiveness of machine learning method applied to psychological characteristics analysis, and this system has practical application value.

In view of the confidentiality requirements of psychological data, we applies the artificial synthetic data method to the psychological prediction problem to make full use of the value of data while preventing privacy disclosure. We first introduces and implements the SMOTE algorithm, and based on SMOTE algorithm, SDBID algorithm for artificial data synthesis based on imbalanced datasets is proposed for the two classification problem. The experiment shows that the performance of the SDBID algorithm proposed in this paper is slightly better than the SMOTE algorithm, and the artificial synthetic data method is practicable in the construction of the psychological system, and it can effectively avoid privacy leaks without affecting the prediction effect.

KEY WORDS: Psychological prediction, machine learning, assemble learning, Synthetic data

目录

摘要 I

Abstract II

第一章 绪论 3

1.1 选题背景及意义 3

1.2 机器学习方法应用于心理学研究的现状 3

1.3 论文组织结构 4

第二章 基于机器学习的心理预测系统实验设计 5

2.1 心理预测系统的功能 5

2.2 基于机器学习的心理预测系统构建流程 5

2.2.1 数据预处理 6

2.2.2 基模型构建 6

2.2.3 基模型分析 7

2.2.4 集成模型构建 7

2.2.5 集成模型分析 7

2.2.6 心理预测系统 7

2.3 模型评价指标 7

2.4 本章小结 8

第三章 数据预处理 9

3.1 数据集成 9

3.2 数据净化 9

3.3 数据分析与特征提取 10

3.4 数据归约 12

3.5 本章小结 13

第四章 基模型的构建和分析 14

4.1 数据集不均衡解决方案 14

4.2 使用决策树算法构建基模型 14

4.2.1 决策树算法介绍 14

4.2.2 决策树算法实现 15

4.3 使用支持向量机算法构建基模型 16

4.3.1 支持向量机算法介绍 16

4.3.2 支持向量机算法实现 18

4.4 使用BP神经网络构建基模型 19

4.4.1 BP神经网络算法介绍 19

4.4.2 BP神经网络算法实现 21

4.5 基模型分析 23

4.6 本章小结 23

第五章 集成模型构建与分析 24

5.1 集成学习概述 24

5.2 应用Adaboost算法构建集成模型 24

5.2.1 Adaboost算法简介 24

5.2.2 Adaboost算法实现与实验结果 26

5.3 应用Bagging算法构建集成模型 27

5.3.1 Bagging算法简介 27

5.3.2 Bagging算法实现与实验结果 28

5.4 应用随机森林算法构建集成模型 29

5.4.1 随机森林算法简介 29

5.4.2 随机森林算法实现与实验结果 30

5.5 各集成模型性能比较与分析 31

5.6 最优集成模型的应用 33

5.7 本章小结 34

第六章 人工合成数据算法在心理预测系统中的应用 35

6.1 人工合成数据算法的应用场景 35

6.2 使用SMOTE算法人工合成数据 37

6.2.1 SMOTE算法介绍 37

6.2.2 SMOTE算法实验 38

6.3 使用SDBID算法人工合成数据 39

6.3.1 SDBID算法介绍 39

6.3.2 SDBID算法实验 39

6.4 实验结果对比及分析 41

6.5 本章小结 42

第七章 总结与展望 43

7.1 本文工作总结 43

7.2 不足及展望 43

致谢 45

参考文献 46

绪论

选题背景及意义

心理危机是指个体在遇到了突发事件或面临重大的挫折和困难,当事人自己既不能回避又无法用自己的资源和应激方式来解决时所出现的心理反应。近年来,全国各地的高校频繁发生大学生因为学业,情感,就业等方面的各种问题导致心理压力大,从而产生自残,自杀甚至伤害他人的过激行为,心理健康因素已经成为影响大学生个体成长和发展以及维护校园稳定的重要因素。

由于高校学生心理健康问题引起的事故对于学校日常的教学工作造成的冲击越来越大,各大高校都对学生心理健康问题高度重视,采取各种措施减少因学生心理健康因素造成的危害。目前,高校通常采用的应对手段为建立心理预警机制,对有较高可能存在心理问题的同学进行密切关注并采取适当措施进行心理干预[1]。然而,受高校负责心理健康工作的人力资源限制,关注人群的数量越多,对每个个体的关注效果就会越差,因此,如何能够准确识别出需要关注的个体是一个现实而亟待解决的问题[2]

剩余内容已隐藏,请支付后下载全文,论文总字数:36199字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;