“研究数据观察应该是几乎各个人今天从业的自然步骤”
研究数据观察应该是大多数人今天工作的自然步骤。 毕竟,谁不想支持越来越多的商业智能提高他们的意见、经验和结果的想法? 数据必须有助于做出决定,并告知这些决定是否正确。
至少,这是目标。 相反,我们发现自己被大量数据轰炸,在我们需要的时候不容易找到正确的数据。 根据newvantage partners的研究,在过去的两年中,表示使用大数据是课题的企业的比例上升,从去年的65%左右上升到了今天的73%以上。
马特·扬科维奇,珀科纳首席经验官。
此外,还应考虑如何更快地访问这些数据。 世界上最大的公司看到数据性能缓慢,每增加一毫秒收入就会下降。 亚马逊估计,2006年,每增加100毫秒,销售额就会减少1%。 10多年后,akamai年的研究表明,同样的延迟将使电子商务平台上的转换减少7%。 对速度的指控并没有消失。 事实上,它影响着比以往任何时候都多的企业。
找到正确的数据并迅速找到意味着需要建立实时的业务服务。 我们需要考虑顾客的期待和如何为他们服务。 而且,必须为支持这些服务的it基础设施提供预算。
如果你是一家大型公司,有庞大的团队,满足这三个要求就更容易了。 但是,如果你是一个小公司,或者你可以支配的资源有限,一般情况下不是这样。 这里重要的是,要开始思考开源是如何有用的。
对预算有限的企业来说,开源是个好选择。 堆栈组件(如操作系统、数据库软件和应用程序)可以根据源代码的可用性进行访问和采用。 一般来说,高级版本可以在商业上使用,没有价格问题。 扩大规模,可以满足多个技术难题。 开源可以帮助各种规模的企业管理更多的数据量。
但是,只移动到开源还不足以支持实时性能要求。 相反,您应该考虑如何从基础架构的所有组成部分获得最佳性能。 其中心是你的数据-更具体地说,是你的数据库。
首先选择正确的数据库设计会对操作的成功产生很大的影响。 评价需要涵盖一系列要求。 例如,nos ql数据库(如mongodb )可以更快地扩展和非常容易地实施,从而支持更快的规模和部署。 但是,mongodb不是可以广泛采用的管理服务。 从mongodb本身购买或运行自己的实例。
或者,您可以看到关系数据库适用于您的业务和服务。 使用sql查询语言很容易找到可以使用这些数据的人,因此范围很广。 数据库(如mysql )可以很容易地运行,也可以在定义架构的地方。 同样,postgres ql也适用于需要实时数据类型(如时间序列和地理位置)的服务。 postgres ql支持sql,便于数据支持和管理,但也可以轻松解决这些数据用例...
这些开源数据库分别可以支持数百到数千个并发客户请求,但会扩展到数十万或数百万个,从而给数据库实例带来很大的压力。 需要探索提高性能和调整数据库的方法。
数据库调优是需要一点真正经验的行业。 对大多数公司来说,了解数据库是如何经营业务的,以及如何调整数据库不是他们的运营商。 因此,获得良好的咨询建议对于实现实时服务目标至关重要。 这有助于防止常见错误,学习如何使用群集和其他规模的技术进行扩展,并为未来正确的做法做出明智的决策提供必要的帮助。
同样,其他应用也值得查看。 数据库可能运行正常,但似乎是请求的瓶颈。 如果没有与其他应用程序组件(如消息队列和分析工具)很好地集成,这些区域的性能可能会影响服务请求的解决速度。 在上下文中检查这些其他应用程序元素,以了解开源产品是如何有用的是值得的。
例如,存储系统可能会影响性能。 随着时间的推移,包含数据库的单个文件必须坐在任意格式的存储器中。 随着有越来越多的数据进入,使用压缩减少数据消耗空是有意义的,但如果需要读取或写入数据,则会影响性能。
糟糕的存储和压缩方法可能会降低性能,如果试图管理开销,客户将付出高昂的代价。 使用开放源文件系统zfs,您可以在不影响性能的情况下压缩数据并节省存储成本。
同样,通过查看如何管理系统中已解析消息的队列,可以提高整体效果。 像rabbitmq这样的提供可以随着时间的推移管理通过应用程序的消息流,因此可以增加应用程序可以扩展以解决相同数量的硬件请求的总体数量。 通过获得这样的高效增益,应用程序可以实时解决越来越多的并发客户,从而获得相同水平的消耗。
无论业务规模如何,客户都必须访问和快速访问正确的数据。 同时,能够实时应对客户发展的诉求服务必不可少。 这样的指控过去只是谷歌和亚马逊等企业的关注。 现在各企业必须实时考虑。 开源技术可以帮助你的企业满足这个主张。
免责声明:亚洲报业网是一个完全人工审核编辑的开放式分类目录网站,本篇文章是在网络上转载的,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本站将予以删除。
心灵鸡汤: