基于DMS数据挖掘系统设计与实现

 2023-04-16 09:00:39

论文总字数:14116字

摘 要

本设计主要针对电信计费系统中的后台数据服务进行程序设计。随着我国电信网络的迅速发展,电信网络设备和网管系统的数量和类的不断增加,迫切需要解决网络管理及故障的快速响应问题。在电信系统中,通常需要根据用户的登入登出来作为计费依据的数据,这样一来,我们就需要根据用户的登入登出日通过网络将匹配好的用户登录记录发送给收集系统服务器,服务器收到匹配好的用户登录记录数据,然后保存接收到的用户数据到用户登录明细表,到最终将用户登录数据记录时间表融和成日报表,月报表和年报表。在该系统中,客户端的功能包括定期收集从服务器的日志文件的用户数据,匹配登录/注销的信息,将数据发送到服务器;该服务器的功能包括客户端数据的存储,数据发送数据接收和整合数据。

关键字:数据挖掘;客户端;服务端;数据匹配

Abstract

This design mainly for telecommunication billing systems programming background data services.With the rapid development of China"s telecommunications network, increasing the number and type of telecommunications network equipment and network management systems, the urgent need to address the issue of network management and rapid response to faults.In a telecommunications system, usually based on the user"s Dengru Deng out accounting basis as data, so that, we need the user"s login logout logs for data matching, form a complete login records, including login names , login time, logout time.In this system, will match good user login records sent to the collection system server through the network, the server receives a good match for a user logs record data, and then received a user logs record-keeping data to the database user login records schedule and the final user can log on schedule recording data integration into Japanese reports, monthly statements and annual reports.In this system, the client"s features include regular collection of user data from the server log files, matching login / logout information, send data to the server; the server features include data reception sent by the client, storage, data and integrate data.

Keywords: Data Mining; Client; Server; Data Matching

目录

第一章 项目背景 1

1.1 国内外发展状况 1

1.2系统的研究意义 2

第二章 系统分析 3

2.1 需求分析 3

2.2 功能模块 3

2.3系统用例 4

2.3.1用例图 4

2.3.2用例描述 4

2.4业务流程 5

2.4.1业务流程中几个存储文件的命名规则 5

2.4.2业务规则说明 6

2.5数据库设计 6

2.6总体类图设计 8

2.6.1数据采集客户端 8

2.6.2数据采集服务器端 13

2.6.3数据整合类图 18

第三章 系统的实现 21

3.1 系统采用原理和关键技术 21

3.2 系统的实现结果 21

3.3结论 25

3.4建议 25

第四章 系统测试方案 26

4.1 数据采集客户采集点测试 26

4.2 数据采集服务器接收存储点测试 27

4.3 数据整合测试 27

谢辞 29

基于DNS数据挖掘系统的设计与实现

第一章 项目背景

1.1 国内外发展状况

在近几年,在信息技术高速发展之下,计算机中保存的文件数量和数据库中的数据量正以指数的速度迅速增长,面对如此一个大数据时代,人们更加期望从数据中提取自己有用的信息。随着我国电信网络的迅速发展,电信各专业网络设备和网管系统的数量和类都在不断增加,迫切需要解决网络管理及故障的快速响应问题。

在国外,数据挖掘技术已经各个领域普遍得到应用。与国外相比,我国对于数据挖掘技术的研究稍晚一点,并且没有形成一整套属于自己的体系。数据挖掘的发展道路也挺曲折的,1993年,数据挖掘第一次被自然科学的基金会作为一个科学研究项目支持。而我国的发展比较晚,但是现在国内也有了很多个科学研究机构开始研究数据挖掘这个领域,研究如何应用数据挖掘,在国内引起了一股追逐的热潮。有许多这个方面的例子,有复旦的教授,他叫做施伯乐,他们在数据挖掘上做出了一项突破,研究了一种挖掘数据的工具,被称为AMINER.又有背景大学的教授,他们主攻智能科学方面,唐世渭和杨冬青两位教授开发了一种系统模型,这种模型可以对客户进行分析在空间上的数据的挖掘方面,这种模型称为CAS2DM。这类的例子还有很多,总之数据挖掘将在这方面会有很多空前的发展,在未来将会在许多领域得到广泛的应用。

数据库的将挖掘技术已经不仅仅是少数人的研究项目了,更多的人开始研究这个技术,已经引起了一份热潮。而且数据库挖掘技术从最初的那种数据的各种查询,到后来的可以提供一种决策支持技术还可以帮助我们挖掘出知识从庞大的数据之中。

什么是数据挖掘技术,相信很多人都比较模糊,这里简单来说,它就是一门数据的管理技术,它和许多的领域都有着联系,比如我们常见的人工智能这一门学科之中,它也和机器学习有联系,而且它还有着高性能的计算作为基础。所以,随着这些技术的不断发展,人们越来越认识到大数据时代,人们对数据挖掘的重要性和依赖性,逐渐走出一片璀璨的天地。

在数据库业界,数据挖掘的进化经历了四个阶段:数据的搜集阶段、数据的访问阶段、数据的仓库阶段和决策的支持阶段、数据的挖掘阶段。

表1.1 数据挖掘研究的进化历程

1.2系统的研究意义

对于电信运营商新增一项Open Lab(开放实验室)出租业务来说,面对庞大的用户登入/登出数据,如何有效的进行数据采集与整合对于电信企业是非常重要。采集系统的重点是用户登入/登出时间能否被及时采集,采集后对于数据正确的挖掘,从而确保电信企业的计费系统方便的实施。对于每个登入的用户进行登入/登出的计录,并且把用户的记录进行有效有序的管理,能够高效又可靠的计算出用户的登入/登出时间,因此对于实验室的出租业务必须编出一套数据采集的系统,实现计算机化的操作,此系统的安全可靠对于提高商业效率具有重要意义。

数据采集系统给电信这种企业带来了空前的发展,成为了它的一个组成成分,不能够分割。传统的电信计费都是依赖于人动手完成的,那个时候的用户群比较少,而且对这个方面的需求也没那么强烈,简单的人工计费勉强可以满足少量的使用者的需求。但是,随着信息化时代的不断进步,数据量不断得到扩大,用户已经形成了一种蜂窝群体。这单靠手工完成是一种拖延和手忙脚乱的局势。现如今,如何快速准确的进行计费成为了一个值得关注的现实问题。计费不仅要讲究快速,要求数亿的信息可以同时的完成统计,还得数据更新,而且还需要讲究精确性,要求可以准确的统计出用户使用的信息,这样保证用户可以信任这个企业的文化,如果系统总是出错也会使得人们对企业的抱怨加大。我们这个系统就是为了满足高效率,高准确度、高速度的计费,为了形成一个完整的计费体系。

数据采集系统使得大数据可以被采集,节约了许多资源空间,采集起来更加方便快捷,避免了传统数据采集时精力、时间和空间资源的消耗。电信计费系统的开发提高了工作效率,给人们的生活带来了巨大的方便,同时也给我们的生活质量带来了一个突破。解决了许多传统手工方式的不足,以及使得人工工作逐渐得到解放。而且数据采集系统现在不仅仅只是采集数据,还可以在很多的方面得到应用,比如可以用它来获取有用的知识信息,这为我们快速浏览信息做了很大的贡献,节约了浏览不重要信息的时间。而且数据采集还可以支持现在比较受欢迎的决策支持技术,这样我们管理提供了很大的帮助。数据采集给我们的管理,决策带来了许多的便利,也给许多人提供了许多数据支持。

第二章 系统分析

2.1 需求分析

社会是一直追求不断突破和创新的,停滞不前只会使社会不断的退步。经济在高速的发展大街上遍地都是各种电信企业,而且人们的生活档次逐渐提升,从低品质的动手生活,到后来的机器信息化以及自动化的发展,人们的享受得到了很大的突破。信息化的发展,给世界带来了许多的数据,一天之内信息漫天飞舞,铺天盖地的席卷这社会。大数据时代的到来,迫使人们开发新的技术来承装这些大的数据和信息,来分析这些数据。

电信企业,每天都会有许多用户,他们时而登陆时而又登出,这些用户的数量巨大,而且他们的状态也一直在变化着,我们如何对这些用户以及状态进行信息存储以及日志信息的记录。这是本系统需要考虑的一个问题。

传统的那种手工计费方式,会无法及时更新数据信息,也需要大量的人力资源消耗,而且就算花费了很大的代价,可能因为数据量太大,变化也太快,无法准确的进行计费。

我们就需要一个依靠计算机设计的系统,可以同时存储很多用户,并且记录用户日志信息,节约人力资源的代价,还有提高工作效率的系统。

2.2 功能模块

本系统有如下几个功能,如图2.1 系统功能图所示:

数据采集客户端 数据采集服务器

图2.1系统功能图

读取数据:这个模块主要是把数据传送给匹配模块,这些数据一方面来自于从用户登陆是系统记录下来的文件,另一方面来自于记录没有匹配的文件之中的数据,这主要是读取数据。

匹配数据:主要是负责从读取到得数据之中,找出可以匹配的登陆以及登出的用户数据,然后开始计算它们的时间,从而完成计费。如果用户只登陆,还没有登出,那么就会在下一次进行重新匹配。

发送数据:这个模块主要是发送数据,数据时从匹配模块发送到采集系统服务器之中,这些数据时已经匹配好的数据,在网络的桥梁之下发送过去的。如果没有发送成功,将会再下一次重新发送。

数据的接收:这个模块主要是用来读取客户端的数据,客户端匹配好的数据发送过来,这边对数据进行读取。

数据的保存:这个模块把已经收到的数据,分别保存到各自对应的表里。

数据的整合:这个模块是最后一个功能,把不能识别的数据转变成可以识别的例如日报表,与此类似的月报表,当然还有年报表里面。

2.3系统用例

2.3.1用例图

图2.2系统用例图

2.3.2用例描述

1.数据采集客户

描述要素

描述内容

备注事项

用例名称

数据采集客户端

用例编号

用例简述

1.读取日志文件,同时清空日志。

2.读取解析用户登录时间和其他信息的数据。

3. 将用户登录到服务器上的数据分析发送到服务器。

4. 如果发送失败,它被存储在服务器发送需等到下一次。

参与者

系统管理员

前置条件

需要root权限

后置条件

日志文件备份清空后。

特殊需求

表2.1数据采集客户

2.数据采集服务器

表2.2数据采集服务器

3.数据整合

描述要素

描述内容

备注事项

用例名称

数据的整合

用例编号

用例简述

1.每小时每个用户的业务整合一下用户登录的时间数据。

2.每天每个用户的业务整合一下用户登录的时间数据。

3.每月每个用户的业务整合一下用户登录的时间数据。

4.每小时每个系统的服务器整合一下用户使用情况的时间数据。

5每天每个系统的服务器整合一下用户使用情况的时间数据。

6.每月每个系统的服务器整合一下用户使用情况的时间数据。

参与者

系统管理员

前置条件

后置条件

产生整合数据。

特殊需求

表2.3数据整合

2.4业务流程

2.4.1业务流程中几个存储文件的命名规则

(1)首先会从外部传递一个日志文件,这个文件给客户端。客户端做出判断,如果发现这个文件是系统存在的,客户端相应,开始保存这个文件。如果不存在,就对其不作出响应。采集文件,它们有的是用当前的日期命名的,有的是用源文件的名称来命名的。

(2)当我们对用户登陆和登出进行匹配的时候,如果它们没有成功匹配,就用faillog.dat来命名。

(3)如果数据项集合发生失败了,文件就会被保存在failsend.dat之中。

2.4.2业务规则说明

登入或者登出的数据项读取规则:由于系统日志文件中的很多数据项都有许多不同类型的类,可以根据它的登录类型以及它的登陆名称,从而判断出需要采集的信息,哪可以被舍弃的信息,能够被采集的数据项需要满足例如下面的条件才可以是被采集的:

(1)例如登录名是以(.)开头,一般的登录程序是它自己的日志数据项,如果它是非法数据,没有采集。

(2)如登录的类型必须是7(登入)或8(登出),则其他类型就可以舍弃了。

2.5数据库设计

根据需求,数据库关系如下:

表2.4用户登录记录明细表

表2.5用户登录记录日报表

表2.6用户登录记录月报表

表2.7用户登录记录年报表

2.6总体类图设计

2.6.1数据采集客户端

(1)类结构概要说明-类图

(2)类功能结构说明-时序图

(3)文件配置说明

剩余内容已隐藏,请支付后下载全文,论文总字数:14116字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;