基于通信数据的移动用户行为分析
- 格式:doc
- 大小:646.50 KB
- 文档页数:10
移动互联网应用中的用户行为分析与预测近年来,移动互联网应用已经成为人们日常生活中不可或缺的一部分。
移动互联网应用的兴起,让人们享受到了便利的同时也让我们意识到用户行为的重要性。
因此,用户行为分析与预测逐渐成为了移动互联网应用中不可或缺的一环。
一、用户行为分析用户行为分析可以帮助移动互联网应用开发者更好地了解用户在使用过程中的行为,进而对产品体验、市场定位等方面做出相应的优化和调整。
用户行为分析可以分为三个方面的内容:1.用户活跃度分析用户活跃度分析主要是通过统计用户的日活跃度、周活跃度、月活跃度等指标,了解用户的使用量、使用频率等一系列活跃度指标。
进而优化产品体验和功能,提高用户留存率,增加用户粘性。
2.用户行为路径分析用户行为路径分析主要是通过分析用户在移动互联网应用中的操作流程,了解用户使用产品时的具体步骤和个性化需求。
通过这些信息,可以为用户设计更加便捷、优质的服务体验。
3.用户流失率分析用户流失率分析是了解用户对产品的不满意程度,以及流失率的变化趋势等相关内容。
分析这些数据可以帮助开发者了解用户对产品的真正需求,以及用户忠诚度方面的问题。
二、用户行为预测用户行为预测有两个方面,一是通过历史数据分析和现有数据建模预测未来发展趋势,二是在用户使用产品时对用户进一步行为的推断预测。
1.用户未来发展趋势预测移动互联网的用户数据量庞大,历史数据的分析可以帮助开发者了解用户的使用习惯和需求,从而做出相应的预判和规划。
基于历史数据的清晰分析,开发者可以制定针对不同用户群体的口径,从而更好地满足用户的需求。
2.用户行为进一步推断预测用户行为的进一步推断预测可以通过推荐算法来实现。
根据用户的历史数据,可以分析用户的喜好和用具体需求,并根据这些数据帮助用户优化搜索引擎、信息推送等功能,提高用户的满意度。
三、结合深度学习的用户行为分析与预测模型随着深度学习技术的不断发展,一些深度学习算法也可以被应用于用户行为分析与预测中。
话单分析系统基于通信模式的用户行为分析功能话单分析系统是一种基于通信模式的用户行为分析工具,通过对用户话单数据进行深入分析和挖掘,帮助企业了解用户的行为模式和需求,从而优化产品和服务,提升用户满意度和企业竞争力。
本文将围绕基于通信模式的用户行为分析功能展开,介绍其原理、应用和实现方法。
一、原理1. 通信模式分析:通过对用户话单数据的识别和分析,了解用户的通信行为模式,包括通话频率、通话时长、通话对象、通话时间段等。
通过对通信模式的分析,可以判断用户的社交圈子、聚集地点、活动时间等信息。
2. 用户行为分析:通过对用户话单数据进行挖掘和分析,了解用户的行为偏好和习惯,包括拨打特定号码、使用特定功能、使用特定时间段等。
通过对用户行为的分析,可以推测用户的兴趣爱好、工作习惯等信息。
二、应用1. 客户关系管理:通过对话单数据的分析,可以提供客户关系管理系统(CRM)所需的信息,帮助企业了解客户的偏好和需求。
企业可以根据用户的通信模式和行为进行精准的营销活动,提高客户满意度和销售额。
2. 用户行为预测:通过对用户话单数据的分析,可以预测用户的未来行为,如购买倾向、流失概率等。
企业可以根据用户的通信模式和行为进行个性化推荐和定制化服务,提升用户体验和忠诚度。
3. 欺诈检测:通过对话单数据的分析,可以识别出用户的异常行为模式,如频繁拨打陌生号码、大量短时通话等。
企业可以采取相应措施,提醒用户注意安全、防止欺诈事件的发生。
4. 运营优化:通过对用户话单数据的分析,可以监控和评估产品和服务的运营情况,如通信质量、话费消耗等。
企业可以根据用户的通信模式和行为,针对问题进行优化和改进,提升产品竞争力和运营效率。
三、实现方法1. 数据采集:话单数据可以通过运营商提供的接口或业务支撑系统进行采集和存储。
采集的数据包括通话记录、短信记录、上网记录等。
为了保护用户隐私,需要严格遵守相关法律法规和个人信息保护政策。
2. 数据清洗:采集到的话单数据可能包含噪声和异常值,需要进行数据清洗和预处理。
基于大数据的石河子电信移动用户消费行为研究基于大数据的石河子电信移动用户消费行为研究随着信息时代的到来,移动通信技术的迅速发展和普及,移动用户的数量迅速增加,如何有效分析和研究移动用户的消费行为已成为电信运营商关注的焦点之一。
本文将通过采集和分析大数据,以石河子地区的电信移动用户为研究对象,探讨其消费行为的特点和影响因素,旨在为电信运营商提供决策支持和精准营销的参考。
一、石河子电信移动用户的消费特点通过对大量的数据进行统计和分析,我们发现石河子地区的电信移动用户的消费行为表现出以下几个特点。
1. 消费金额较为稳定:石河子电信移动用户的消费金额在一个相对稳定的范围内波动,整体上呈现出较为平稳的趋势。
这与当地相对固定的生活和工作环境有关。
2. 超额套餐消费较多:相较于按需套餐,石河子电信移动用户更倾向于选择超额套餐。
我们分析发现,超额套餐的消费占比较大,这可能是用户为了应对突发业务需求或习惯性选择超额套餐。
3. 流量使用量差异大:通过对流量使用情况的分析,我们发现石河子电信移动用户的流量使用量差异较大。
一部分用户使用较少的流量,注重基础通信业务需求;而另一部分用户则是重度流量用户,其流量消耗集中在音视频娱乐、社交平台等方面。
4. 大部分用户偏好普通话音频通信:分析用户通信方式的偏好,我们发现绝大部分石河子电信移动用户更习惯于使用普通话进行音频通信,而对于视频通信的使用较为有限。
这可能与地区的文化背景和通信场景有关。
二、影响石河子电信移动用户消费行为的因素除了消费行为的特点外,我们还对影响石河子电信移动用户消费行为的因素进行了分析。
1. 用户属性因素:不同年龄段、职业、收入等用户属性对消费行为的影响较为明显。
例如,年轻用户更倾向于选择高价值的套餐,而中老年用户更注重流量的实际使用和费用控制。
2. 套餐和优惠策略因素:电信运营商推出的不同套餐和优惠策略对用户消费行为有显著影响。
套餐价格的合理性、流量和通话时长的分配以及升级换机等优惠活动都会对用户产生消费意愿和行为。
基于通信数据的移动用户行为分析基于通信数据的移动用户行为分析引言通信数据的特点通信数据是通过网络传输的数据,在移动用户行为分析中具有以下特点:1. 海量性:移动网络每天大量的通信数据,包括用户的通信记录、位置信息、流量情况等。
这些数据的规模庞大,对于数据的存储和处理提出了挑战。
2. 多样性:通信数据具有多种类型,包括短信、方式通话记录、网络流量等。
不同类型的数据有不同的分析方法和应用场景。
3. 动态性:移动用户的行为是随着时间变化的,通信数据需要实时地进行实时采集和分析。
移动用户行为分析方法移动用户行为分析是通过分析通信数据来研究用户的行为和特征。
常用的移动用户行为分析方法包括:1. 用户分类:根据用户的行为特征将用户进行分类。
例如,根据用户的通话时长、通信次数等指标,将用户分为高活跃度用户和低活跃度用户。
2. 轨迹分析:通过分析用户的位置信息,研究用户的出行路径和行为轨迹。
例如,通过分析用户的位置信息,可以推断用户的常住地和工作地。
3. 行为模式挖掘:通过分析通信数据的时间和空间特征,挖掘用户的行为模式。
例如,通过分析用户的通信记录和位置信息,可以挖掘用户的日常活动规律和兴趣偏好。
4. 用户关系分析:通过分析用户之间的通信关系,研究用户之间的社交网络结构和影响力。
例如,通过分析用户之间的通信频率和通信密度,可以挖掘用户之间的社交关系。
移动用户行为分析应用移动用户行为分析在许多领域都有着重要的应用价值,包括:1. 个性化推荐:通过分析用户的行为特征和兴趣偏好,为用户提供个性化的推荐服务。
例如,根据用户的通信记录和位置信息,向用户推荐附近的餐厅和景点。
2. 网络性能优化:通过分析用户的通信行为,优化网络资源的分配和调度策略。
例如,根据用户的流量需求和通信质量要求,调整网络的带宽分配和信道分配。
3. 安全防护:通过分析用户的通信行为,检测网络攻击和异常行为。
例如,通过分析用户的通信流量和通信频率,检测用户之间的异常关系和异常流量。
基于通信数据的移动用户行为分析在当今数字化的时代,移动设备已经成为人们生活中不可或缺的一部分。
我们通过手机进行通话、发送短信、浏览网页、使用各种应用程序等等,这些行为产生了大量的通信数据。
对这些通信数据进行深入分析,能够揭示出移动用户的行为模式、偏好和需求,为企业的市场营销、网络优化以及公共服务的提供等方面提供有价值的参考。
通信数据的类型多种多样,包括通话时长、通话频率、短信数量、数据流量使用情况、应用程序的使用时间和频率、位置信息等等。
这些数据看似繁杂无序,但通过合适的方法和技术进行处理和分析,就能够挖掘出其中隐藏的宝藏。
首先,我们来看看通话行为。
通话时长和通话频率可以反映出用户与他人的社交关系紧密程度。
例如,经常与某几个特定号码进行长时间通话的用户,很可能与这些号码的主人有着密切的关系,比如家人、朋友或者工作伙伴。
而通话时间的分布,比如在白天还是晚上通话更多,也能揭示用户的生活和工作规律。
如果一个用户在工作日的白天通话较少,而在晚上和周末通话较多,可能说明他的工作性质比较特殊,或者工作压力相对较小。
短信数量虽然在如今的即时通讯应用盛行的时代有所减少,但仍然能提供一些有价值的信息。
短信的发送对象和内容,可以反映出用户的沟通方式和情感表达习惯。
比如,习惯于发送简短、直接的短信的用户,可能性格较为直率;而喜欢发送较长、措辞较为委婉的短信的用户,可能性格更为细腻。
数据流量的使用情况是另一个重要的分析维度。
不同类型的应用程序所消耗的数据流量各不相同。
比如,视频类应用通常消耗大量的数据流量,而文字类应用则相对较少。
通过分析用户数据流量在不同应用上的分配,可以了解用户的兴趣爱好和日常需求。
如果一个用户在视频播放类应用上消耗了大量的数据流量,那么可以推测他喜欢观看视频内容,可能是电影、电视剧或者短视频。
而如果一个用户在在线学习类应用上使用了较多的数据流量,那么他很可能是一个积极进取、热爱学习的人。
应用程序的使用时间和频率也能反映出用户的行为习惯和偏好。
电信行业中的大数据分析与用户行为分析随着互联网的快速发展和人们对通信需求的不断增长,电信行业正面临着一个数据爆炸的时代。
海量的用户数据涌入电信运营商的数据库中,这些数据蕴藏着许多有价值的信息。
因此,如何利用这些数据进行大数据分析和用户行为分析,成为电信行业发展的关键之一。
一、大数据分析在电信行业的应用1. 数据清洗与预处理电信运营商的数据库中存在着大量不规范和冗余的数据,需要进行清洗和预处理,使其变得更加规范和有序。
通过数据清洗和预处理,可以提高后续数据分析的精度和效果。
2. 数据仓库与数据挖掘电信行业的大数据分析离不开数据仓库的建设和数据挖掘的技术。
通过建立完善的数据仓库系统,将不同来源的数据进行整合和处理,为后续的数据分析提供基础。
同时,通过数据挖掘的技术,可以从海量的数据中挖掘出有价值的信息和规律,帮助电信运营商做出更加准确的决策。
3. 数据可视化与业务分析大数据分析的结果需要以直观的方式展示给决策者和业务人员。
通过数据可视化的技术,将复杂的数据分析结果通过图表、仪表盘等方式展示出来,帮助决策者和业务人员更好地理解和利用这些数据。
二、用户行为分析在电信行业的应用1. 用户群体的细分与定位电信运营商通过对用户行为的分析,可以将用户细分为不同的群体,比如年龄、性别、地域、消费习惯等。
有了准确的用户细分信息,电信运营商可以有针对性地制定推广策略,提高营销的效果。
2. 用户需求的预测与推荐通过对用户行为的分析,电信运营商可以了解用户的需求和偏好,并预测用户的未来行为。
基于这些分析结果,电信运营商可以为用户提供个性化的推荐和服务,满足用户的需求,提升用户的满意度和忠诚度。
3. 用户流失的预警与挽回用户流失是电信行业面临的一个重要问题。
通过对用户行为的分析,可以及时发现用户流失的迹象,并采取相应的措施进行挽回。
比如,可以向高流失用户提供个性化的优惠券、产品推荐等,以提高他们的留存率。
三、大数据分析与用户行为分析的挑战与机遇1. 挑战大数据分析和用户行为分析需要处理海量的数据,对数据存储和计算能力提出了更高的要求。
基于大数据分析的移动App用户行为研究与个性化推荐随着智能手机的普及以及移动互联网的迅猛发展,移动App变得越来越普遍,并成为人们生活中不可或缺的一部分。
在这个信息爆炸的时代,用户面对众多的App选择,如何为用户提供个性化的推荐变得尤为重要。
基于大数据分析的移动App用户行为研究可以帮助提供精准的个性化推荐,为用户提供更好的使用体验。
一、移动App用户行为研究的意义移动App用户行为研究是通过分析用户在App上的操作行为、浏览习惯、喜好偏好等数据,了解用户的行为特征和需求,从而为用户提供更加个性化的服务。
这样的研究可以帮助企业了解用户需求,提供更加贴近用户的产品和服务,提高用户满意度和用户留存率,同时也可以提升企业的收入与竞争力。
二、移动App用户行为研究的方法1. 数据收集与分析:通过在移动App中嵌入数据收集代码,收集用户的操作行为数据,包括点击、浏览、购买等行为,同时还可以收集到用户的个人属性信息,如性别、年龄、地理位置等。
通过对这些数据进行分析,可以揭示用户的偏好、习惯和需求。
2. 数据挖掘与模型建立:通过数据挖掘技术,对收集到的用户行为数据进行挖掘,发现潜在的模式和规律。
根据挖掘结果,可以建立用户模型,对用户进行分类和划分,以便为不同类型的用户提供个性化推荐。
3. 用户画像建立:通过对用户行为数据的分析,可以建立用户画像。
用户画像是对用户的全面描述,包括用户的兴趣爱好、消费习惯、社交圈等。
通过用户画像,可以更好地了解用户的需求和行为特征,为用户提供更加个性化的服务。
三、移动App个性化推荐的方法1. 协同过滤推荐:协同过滤是一种常用的推荐算法,它通过分析用户的历史行为和喜好,找到与其兴趣相似的其他用户或物品,并将这些相似用户或物品的推荐给用户。
这种推荐方法简单易用且效果较好,被广泛应用于移动App个性化推荐中。
2. 基于内容推荐:基于内容的推荐是根据用户过去的行为和偏好,对App中的内容进行标签和分类,从而为用户推荐与其喜好相关的内容。
基于大数据的移动社交网络中用户行为分析研究随着移动互联网的迅猛发展,移动社交网络成为人们交流、分享和获取信息的重要平台之一。
在这个以人为中心的网络环境中,用户行为对于移动社交网络的发展和运营至关重要。
基于大数据的用户行为分析成为了研究者和企业关注的焦点,能够帮助平台提供个性化推荐、改善用户体验和优化营销策略。
本文旨在探讨基于大数据的移动社交网络用户行为分析的相关研究进展和应用前景。
首先,大数据技术为移动社交网络的用户行为分析提供了有效的支持。
移动社交网络产生了大量用户行为数据,如用户的个人资料、好友关系、发帖、评论、点赞等记录。
这些数据规模庞大、时效性强,传统的数据处理方法往往无法胜任。
大数据技术的引入,包括分布式存储与计算、机器学习和数据挖掘算法的发展,为处理和分析移动社交网络数据提供了可行的方案。
用户行为分析可以通过大数据技术实现跟踪、预测或者关联用户行为和用户特征。
其次,基于大数据的用户行为分析在移动社交网络中具有广泛的应用价值。
首先,用户行为分析能够帮助社交网络平台提供个性化推荐。
通过分析用户的行为数据,如点击、浏览历史和社交关系,平台可以根据用户的兴趣和偏好,推荐相关的内容、人际关系或者广告。
个性化推荐能够提高用户满意度,并促进平台的用户活跃度和粘性。
其次,用户行为分析可以帮助改善用户体验。
通过分析用户在移动社交网络上的行为特征和用户反馈,平台可以发现用户使用的痛点和需求,从而优化产品功能、界面设计和交互体验。
第三,用户行为分析也可以帮助移动社交网络优化营销策略。
通过分析用户行为数据,平台可以洞察用户对广告的反应和购买行为,从而针对不同用户制定个性化的营销策略,提高广告投放效果和营收。
在基于大数据的用户行为分析中,对于用户隐私和数据安全的保护是重要的考虑因素之一。
移动社交网络平台通常会收集用户的个人信息和行为数据,并使用这些数据来进行用户行为分析。
然而,滥用和泄露个人信息的风险也在增加,需要平台采取一系列措施来确保用户数据的安全和隐私保护。
基于大数据分析的移动应用用户行为分析研究移动应用用户行为分析是一项通过大数据分析来了解和研究移动应用用户行为的方法。
随着智能手机的普及,移动应用的使用越来越广泛,用户行为分析成为了许多企业和开发者必须重视的课题。
本文将探讨基于大数据分析的移动应用用户行为分析的重要性、方法及应用。
一、基于大数据分析的移动应用用户行为分析的重要性移动应用用户行为分析的重要性在于它可以帮助我们了解用户的使用习惯和需求,为开发者和企业提供有效的数据支持。
通过分析用户行为,我们可以得出用户对移动应用的喜好、使用偏好和消费习惯,从而改善产品和服务。
首先,通过大数据分析移动应用用户行为,能够为开发者提供有关用户行为的关键数据。
通过分析用户在移动应用中的点击、浏览、购买、评论等行为,开发者可以了解用户对产品的使用情况,从而改进产品的功能和界面设计。
例如,通过分析用户在游戏应用中的游戏习惯和购买行为,开发者可以优化游戏难度、增加虚拟道具等,提升用户体验,促进用户留存和付费。
其次,基于大数据分析的用户行为可以帮助企业了解用户需求和市场趋势。
通过分析用户的搜索、购买和评论行为,企业可以了解用户对产品的需求和偏好,发现潜在的市场机会。
例如,电商平台可以通过分析用户购买行为,了解用户对不同产品的需求,并据此优化商品推荐和促销策略,提高销售额。
最后,移动应用用户行为分析还能帮助企业提升用户粘性和留存率。
通过分析用户在应用中的使用时长、使用频率和使用路径,企业可以了解用户的使用习惯和潜在痛点,从而为用户提供更加个性化的产品和服务,增加用户黏性。
例如,在社交应用中,通过分析用户的好友交流频率和兴趣偏好,可以为用户推荐更加符合其兴趣的内容和社交功能,提升用户留存率。
二、基于大数据分析的移动应用用户行为分析方法1. 数据收集:首先,需要收集移动应用中用户行为的相关数据,包括用户点击、浏览、购买、评论等行为数据。
可以通过使用数据收集工具来获取用户行为数据,如用户行为分析工具、数据追踪代码等。
基于通信数据的移动用户行为分析[摘要] 认为分析移动用户行为特征与分类,对移动应用个性化服务的改进具有重要的参考价值。
基于国内电信运营商随机抽取某市一万移动用户一周的日志记录,其中含有4万余条通话记录和200余万条网络请求,每条请求包含对应的基站标号以及基站地理位置。
本研究从消费能力、通话量、网络请求量、位移量四个维度从这批数据中提取14种基本特征指标。
利用K-Means聚类方法将移动用户区分成规律通话型、随机上网型、居家节约型和随机高消费型等四类用户模型。
[关键词] 用户行为分析;移动用户研究;聚类分析;数据挖掘[分类号] G351 引言随着移动通信技术的迅猛发展和广泛应用,移动终端大量普及于民众,也产生了大量用户信息记录,如何利用大数据来了解移动用户行为与习惯特征的研究不断涌现。
通过对移动用户的分析与了解,许多企业与政府部门可以依据结果提供各式各样的服务与应用方案。
移动用户行为分析通常是指基于地理信息涉及用户访问网络、通话的行为规律与活动研究。
电信运营商通过获取用户访问移动互联网、使用移动应用及通话的行为规律,能够有效地配置网络资源并提供具有针对性的服务。
近年来,针对桌面端日志挖掘的研究层出不穷,[15, 16, 17]都是针对桌面端web服务的后台日志挖掘入手,通过分析用户访问页面的占比、用户访问的页面顺序等对用户的行为进行建模。
而针对移动用户的行为分析研究则在很多方面借鉴了桌面端的研究,同时利用移动端设备的地理位置位置记录,挖掘出用户移动轨迹模式,找出轨迹中重要的位置并结合通信数据、互联网日志数据以及移动应用数据作为研究的基础,分析挖掘移动用户的需求、行为、兴趣,甚至是通过预测用户的目的地、推测用户下一步即将到达的位置以便提供针对性的推荐服务[1, 13]。
传统的移动用户轨迹分析,多数利用软件采集仿真数据,属于细时空粒度下的数据,即可以采集到用户一天中连续时间段的位置数据。
Y.Zhu等作者着眼于用户位置数据中经常出现的地点,并根据出现时间来推测用户所处的位置是家还是公司[2]。
此外,S.Akoush和A.Sameh则通过指定时间粒度,聚类用户在多日同一时间段的行动轨迹,利用稀疏数据拟合出用户在这时间段移动轨迹的目的[3]。
研究用户的移动轨迹,实现预测用户下一步位置目的的方法,包括利用贝叶斯算法、聚类、数据挖掘方法等。
实际上,电信运营商服务器上的数据是粗时间粒度的,唯有请求通信或上网时才会被记录,因此用户位置变化是不连贯的,具有随机性、稀疏性的特点,不能支持用户行为轨迹直接且连续的刻画描述。
谭均元等人提出了生活熵概念作为用户移动轨迹规律程度的度量[4],采用了个人多天时段移动序列的算法来弥补实际数据的这种不足,即通过对多天数据的分析来获得更准确的用户移动轨迹。
S.A.Shad则结合地理信息与用户提供的上下文语义信息来增加预测准确性[5]。
梁鹏等作者则透过在WAP网关进行数据采集,并对数据进行数值分析和拟合,最后得到用户行为的统计性特征来建立用户行为分析模型[6]。
吕洋利用上网数据研究用户的网络请求行为、时间、网页应用、数据包大小等信息建立用户行为模型[7]。
Y.Liu关注于移动用户上网过程中访问频率、访问时间、访问深度之间的关系[8]。
G.F.Zhao等作者则利用二分网络模型来分析移动用户上网过程中用户与不同网站之间的关联。
对移动用户上网请求过程中数据包的大小、请求响应时间等的研究也是与运营商相关的研究方向[9, 10, 11, 12]。
由此可知,国内外对移动用户行为的研究呈现向上的趋势,研究的方法也越来越多样。
笔者基于运营商提供的移动数据,提取用户特征,并将选取的特征作为聚类分析的输入参数,以发现具有不同行为特征的用户类别。
利用消费能力、通话量、网络请求量、位移量四个维度作为分析用户行为的基础,从该批数据中提取相关的评价指标。
通过聚类算法对用户的分类,分析各类型用户所独有的属性、行为特征。
各类用户模型分析结果可以作为电信运营商、服务或应用提供企业根据不同用户类型提供更好的推荐服务。
2 数据集及预处理2.1 数据集本研究的数据集来自国内移动电信运营商某市内的一万注册用户的一周数据,时间为2013年12月的第一周。
数据包括用户基本信息、通话记录、上网记录、以及使用基站地理位置等,其中共有456006条通话记录和21441422条网络请求记录。
该批数据中的所使用到的具体的信息字段包括:用户编号(user_id)、移动产品品牌(brand_name)、用户通话产生的费用(call_fee)、用户上网产生的流量费用(gprs_fee)、增值业务费(databusiness_fee)、终端品牌(brand_chn)、手机操作系统(operation_sys)、通话开始时间(start_time)、通话结束时间(end_time)、通话基站纬度(l ongitud e)、通话基站经度(latitud e)、网络请求时间(start_time)、网络请求基站纬度(l ongitud e)、网络请求基站经度(latitud e)等。
考虑到商业机密和隐私保护,笔者只对部份信息进行分析和结果展示。
2.2 数据预处理数据预处理的主要工作包含删除空记录;删除通话数据异常记录(单一通话连续时长超过十小时);清除与标记部份字段值缺失记录;以及清理用户请求基站服务的异常记录。
通过数据清理与预处理,最后共8916个有效用户。
(1)部份字段值缺失记录该批数据用户的基本信息记录中,对于用户通话产生的费用、用户上网产生的流量费用、增值业务费数据缺失的情况,这是由于用户在相应字段意义内未产生额外费用,统一赋值为0;对于手机品牌或操作系统值缺失的情况,我们推测这是由于用户是用的手机并不属于主流品牌或主流操作系统,统一赋值为其他(OTHER);用户的通话与上网数据记录有开始时间或结束时间缺失,对这部分记录做了删除处理;并且用户通话和上网数据中的位置信息的经纬度缺失的情况,也做了清除处理。
(2)用户请求基站服务的异常记录根据同一用户不同时间的连续位移数据分析,发现部份记录用户在极短时间内进行了极大的位移。
本研究利用通话起始、结束时间、上网请求时间、基站纬度、基站经度来计算用户位移时速,将时速大于100km/h的用户记录清除。
在数据的处理过程中,通过Python这种简单易用的编程语言结合其用于数据分析处理的类库Numpy、Pandas[14]等大大降低了的我们的工作难度。
3 特征选取本研究通过特征选取与统计结果来挖掘移动用户的特征,并利用这特征作为聚类的参数,将移动用户行为分类。
本研究利用消费能力、通话量、网络请求量、位移量四个维度作为分析用户行为的基础。
根据这四个维度的特征从该批数据中提取相关的评价指标,分别包含。
消费能力:通过客户品牌、系统、话费三种来综合用户的消费阶层;通话量:利用每日通话次数、通话时长、每次通话时长、以及各时间段通话时长分布等作为用户通话习惯的评价指标;网络请求量:利用网络请求次数、各时间段的网络请求分布等统计结果作为描述用户上网习惯的特征参数;位移量:使用每日出现的基站数、位置位移量与生活熵的统计和计算结果来描述用户一天中位置变化参数。
3.1 消费能力本研究通过客户品牌、手机系统、话费三种特征来综合评价,评量用户的消费阶层。
该批数据的电信运营商提供主要三个客户品牌: 动感地带、全球通和神州行,动感地带是面向年轻群体的客户品牌,目标用户是每月月话费值低,但是数据业务比重高的用户。
全球通则面向中高端用户,较早地推出国际漫游和手机银行等加值服务。
神州行则是面向大众用户,客户群的职业、年龄等跨度都较大,资费注重实惠、大众化。
由此可知,客户品牌作为用户个人消费能力的一种特征。
该批数据中,属于“动感地带”客户品牌的用户占全部的66%,使用“全球通”的用户占全部的13%,而“神州行”的用户占全部的21%。
因此,主要手机移动用户以年轻用户为居多,并数据业务比重高的需求大。
由于每个用户移动装置的具体消费型号无法取得,本研究通过该用户手机的品牌与操作系统作为该用户的手机消费喜好参考特征之一,依据用户使用的系统与品牌主要分成安卓(Android)、苹果(iOS)、微软(Windows)、黑莓(Blackberry)以及其他(Other)。
由于安卓系统占很大比例,而且该系统的手机消费分布广泛,因此在切分成三星(Samsung)、小米/魅族,以及其他安卓(Others of Android)。
小米手机和魅族在价位及使用的用户群方面类似,因此本研究将其归为一类。
尽管黑莓系统手机数量很少,但较多专业人员使用,本研究仍单独划为一类。
经统计使用系统的用户比例分别为:苹果,22.02%。
微软,2.32%。
黑莓,0.25%。
三星,19.39%。
小米/魅族,7.92%。
其他安卓,20.12%。
其它系统,27.93%。
由此可知,多数用户仍选用安卓与苹果系统的手机。
用户在使用移动服务的过程中,消费主要分为三类:通话费、流量费和增值业务费。
本研究将这三种消费的总和作为移动用户的消费金额。
统计发现,用户月话费额的均值为51.01元,中位数为33.20元,并且半数的用户话费介于12.77至66.52元之间。
3.2 通话量利用平均每日通话次数、平均通话时长、每次平均通话时长、以及各时间段通话时长分布等分析出用户通话习惯的评价指标。
将计算出用户多天的通话总次数,再除以天数作为平均每日通话次数的计算方式。
根据计算结果,用户平均每天的通话次数为7.19次。
通话最少的用户,7天内只通话一次。
最多的用户则平均每天通话89.43次。
75%的用户平均每天的通话次数在9.14次上下。
相同的,平均每日通话时长是指用户一周的通话总时长,除以天数的计算结果。
该批数据的每日通话时长统计分布如图1所示。
所有用户平均每日通话时长为2440.49s,四分位数分别为724.25s、1481.93s和2854.96s,可见大多数用户每天的通话时间都比较短,少数用户的大量通话行为对平均数影响比较大。
并且,计算用户多天的通话总时长除以通话总次数作为每次平均通话时长。
经统计结果得到用户的平均每次通话时长为335.65s,四分位分别是204.59s、253.18s、352.00s。
每次通话时长最短只有46s,最长的则有3022s.图 1 平均每日通话时长分布为了分析移动用户的通话时长分布,本研究将一天分为8个时间段,从0点开始,每3个小时作为一个时间段。
这划分方式将有意义的区别出用户休息时间、就餐时间、工作时间及上下班时间等。
这8个时段的通话统计结果如图2所示,为了优化展示,图2显示随机抽取十分之一的用户通话数据,纵轴与横轴分别代表平均通话时长与个别用户。