微軟大數(shù)據(jù)解決方案 助力企業(yè)快速發(fā)展
現(xiàn)代信息管理平臺必須支持所有類型的數(shù)據(jù)。SQL Server支持非傳統(tǒng)和非結(jié)構(gòu)數(shù)據(jù)類型已經(jīng)有很長的歷史,現(xiàn)在SQL Server也提供了在企業(yè)內(nèi)部服務器和云上的企業(yè)級Hadoop支持。
微軟新近推出的HDInsight是一種適合企業(yè)使用的、基于HDP的Hadoop服務,可用于Windows Server和Windows Azure平臺,Windows的可靠性、可管理性、和易用性已經(jīng)融入到Hadoop環(huán)境當中。通過減少打包和軟件分發(fā)時間,簡化運營管理并大大減少安裝和配置部署時間。這些功能改進將使得IT部門能夠在整個Hadoop集群中采用一致的安全策略,并通過System Center簡便的管理它們。此外,對于基于云環(huán)境的Windows Azure HDInsight服務,微軟將繼續(xù)降低服務部署的門檻,為客戶提供以服務的方式使用大數(shù)據(jù)的功能,通過基于Web的門戶來簡化Hadoop集群的設置和配置。對于企業(yè)用戶來說,微軟所提供在企業(yè)內(nèi)部服務器上和云端部署可擴展大數(shù)據(jù)的解決方案,可將所有的產(chǎn)品均部署在一個通用的平臺上,并使用自身熟悉的、功能強大的商業(yè)智能工具。
在開源的角度上,微軟承諾對Apache Hadoop API提供100%的兼容性,所有基于Apache Hadoop編寫的應用程序?qū)⒛軌蛟赪indows平臺上運行。通過與Hortonworks密切協(xié)作,微軟已經(jīng)正式提交了在Windows Azure和Windows Server上提供基于Hadoop的軟件方案的實現(xiàn)方案,并將其作為Apache基礎代碼變更的一部分。
通過與全世界數(shù)據(jù)連接在一起提供增強的功能
今天數(shù)據(jù)的價值信息已經(jīng)涵蓋了包括個人數(shù)據(jù)、企業(yè)數(shù)據(jù)、社區(qū)數(shù)據(jù)乃至世界數(shù)據(jù)等不同的應用領域。為了讓企業(yè)更好的發(fā)現(xiàn)內(nèi)部和外部數(shù)據(jù),微軟建立了代號為“Data Explorer”的Azure實驗室,旨在幫助客戶通過自動提議,來發(fā)現(xiàn)相關數(shù)據(jù)集。另一個代號為“Data Hub”的實驗室,旨在幫助企業(yè)或組織創(chuàng)建一個私有的專屬數(shù)據(jù)市場,提升組織內(nèi)部的數(shù)據(jù)發(fā)現(xiàn)、共享和分析的模式。
通過使用Windows Azure Marketplace中的應用程序和智能挖掘算法,用戶還能發(fā)現(xiàn)更多的數(shù)據(jù)挖掘模式。例如Windows Azure Marketplace的DataMarket可以實現(xiàn)防火墻外部和第三方數(shù)據(jù)源的發(fā)現(xiàn)與共享。Windows Azure Marketplace提供第一和第三方應用程序和挖掘模式,客戶可以從他們的數(shù)據(jù)集當中獲得新的業(yè)務洞察。
在優(yōu)化外部數(shù)據(jù)方面,大數(shù)據(jù)解決方案可以通過SQL Server Integration Services(IS)、SQL Server Data Quality Services(DQS)數(shù)據(jù)清洗和SQL Server Master Data Services(MDS)數(shù)據(jù)管理等功能組件將原始數(shù)據(jù)轉(zhuǎn)換為可靠一致的數(shù)據(jù),再通過通過SQL Server Analysis Services(SSAS)的高級分析來實現(xiàn)數(shù)據(jù)的精煉。微軟大數(shù)據(jù)解決方案支持Mahout
