自古以来旅游是中国文化不可缺少的一部分,发展旅游也是为了弘扬中国的民族精神。同时,国家也将发展旅游行业制定为带领偏远地区致富脱贫的方案之一,所以各级政府及相关部门格外重视旅游景区的发展。
但在如今的信息爆炸的时代里,中国互联网的流量每天产品的信息量可刻满1.88亿张光盘,其中人们一天上传的照片数量相当于柯达发明胶卷后拍摄的图片总和。这意味着当旅游景区想要做传播的时候,出一个创意内容或一条传播信息时,就像一滴水掉进了大海,无踪无迹,传播何其难!
面对这一问题,政府及有关部门首先想到的是利用大数据技术来为各地旅游景区提升收益。经过近几年大数据的发展及旅游行业相关政策法规的公布,各景区对大数据逐渐的由陌生到了解,逐渐认可旅游大数据,并开始使用旅游大数据帮助景区提升收益。
最近,某旅游景区找到了睿帆科技,希望利用大数据技术解决广告营销投入居高不下,roi持续走低的现状。针对这一问题睿帆科技迅速组织相关人员开会,经过会议商讨得出,解决这个需求的方法是通过技术找到景区广告没有覆盖的区域,即统计清楚每位游客的来源地,找出游客较少的区域。
确定好技术目标以后,第一步,睿帆科技cto王雪博士带领团队将原始数据里的每个人进行网格化。王雪博士表示,网格化是将已经导入的海量原始数据中每个人的位置先从分布式数据仓库中调取,然后对数据进行预处理合并每个人的停留时长,最后按照时间为维度放入地图上既定的500m x 500m 的范围,再通过分布式计算形成统一的以时间变化的id编码。
例如,某景区是5000m x 5000m的正方形区域,其就会包含100个500m x 500m的范围。将该景区的编号设置为“a”,其中每个500m x 500m的范围就是“a1-a100”,然后将这些景区编号按照每个人的时间维度进行标记。即,张三,13点出现在a1区域,15点出现在a8区域,20点出现在z13区域等。
如果景区不是正方形区域,则会通过景区凹多边形算法划定景区范围。首先,在所有景区的坐标点中找出纵坐标最大的a点,如果有好几个点的纵坐标都是最大的,就从中选出横坐标最小的点定为顶点,这种方法从数学上可以严格证明一定是最大凸多边形的顶点。
其次,连接a点和剩下其它点,形成一系列向量ab,从正向x轴出发顺时针旋转一个角度之后会和向量ab重合,记录下这个最小夹角α。如果有好几个点都形成相等的最小夹角,那么我们选择线段ab长度最长的b点,这个b点就是另一个顶点。以此类推,重复上面的步骤即可圈定景区的范围。
最后,规定每个网格化人的中心点落入景区网格即判定该人在景区旅游。
“选择500m x 500m的区域是因为这样不仅可以达到数据收集的目的,又可以有效的保护每个人的隐私,就像我说我在望京和我在望京soho完全是两个概念。当然在姓名年龄等信息我们也是采取编码加密的方式,举例张三只是帮助理解。”王雪博士表示。
第二步,对游客的筛选。在原始数据中,会包含居住人员、在附近工作人员以及过路人等。根据每个用户的行为习惯,筛选出真正的游客。“居住人员一般只有晚上会在附近出现,工作人员每个工作日会在白天固定时间出现,过路人停留时间短,排除掉这些干扰的数据,我们才能找到真正想要的游客数据。”王雪博士表示。
第三步,对游客追踪地的查找。找到真正的游客,只需追寻他的出发地即可找到游客的来源地。然后再将游客来源地进行统计,找到游客量较少的区域进行重点的广告投放。
值得一提的是睿帆科技可以通过技术手段将游客的居住地精准到县,这极大的为旅游景区降低了广告营销的投入,帮助旅游景区提升了roi。
睿帆科技拥有业内领先技术,致力于解决大数据技术门槛高、实施周期长、技术人员缺乏等问题,帮助客户降低应用大数据技术的成本和周期,提高数据资产转化为客户价值的能力。
公司是中国移动最大的大数据处理供应商,为全国近一半的省份提供数据处理支持。公司团队拥有超过十年的大数据ag九游会官网的解决方案经验,其九游会登陆的合作伙伴有诺基亚、亿阳信通、东软、中国移动、中国联通、天翼云等知名企业,业务涉及通信、金融、政府、医疗、安防、安全等行业。
公司核心成员均来自阿里巴巴、华为、诺基亚、teradata等世界知名企业,皆具有较深的大数据处理经验。其联合创始人兼首席技术官王雪博士,师从中国数据库管理奠定人王珊教授,专注于大数据领域及数据库领域研究多年,曾是华为技术有限公司的数据科学家,参与过华为公有云架构设计的开发。
正是这些强大的技术和丰富的经验让睿帆科技不断获得企业客户的信任,我们相信睿帆科技将有一个不可限量的明天。