>進入 數據挖掘算法是創建挖掘模型的機制。若要創建模型,算法將首先分析一組數據,查找特定模式和趨勢。然后,算法將使用此分析的結果來定義挖掘模型的參數。 算法創建的挖掘模型可以采用多種形式,這包" />
歡迎進入Windows社區論壇,與300萬技術人員互動交流 >>進入 數據挖掘算法是創建挖掘模型的機制。若要創建模型,算法將首先分析一組數據,查找特定模式和趨勢。然后,算法將使用此分析的結果來定義挖掘模型的參數。 算法創建的挖掘模型可以采用多種形式,這包
歡迎進入Windows社區論壇,與300萬技術人員互動交流 >>進入
數據挖掘算法是創建挖掘模型的機制。若要創建模型,算法將首先分析一組數據,查找特定模式和趨勢。然后,算法將使用此分析的結果來定義挖掘模型的參數。
算法創建的挖掘模型可以采用多種形式,這包括:
說明在交易中如何將產品分組到一起的一組規則。
預測特定用戶是否會購買某個產品的決策樹。
預測銷量的數學模型。
說明數據集中的事例如何相關的一組分類。
Microsoft SQL Server 2005 Analysis Services (SSAS) 提供了幾個供您在數據挖掘解決方案中使用的算法。這些算法是所有可用于數據挖掘的算法的子集。您還可以使用符合 OLE DB for Data Mining 規范的第三方算法。有關第三方算法的詳細信息,請參閱插件算法。
Analysis Services 包括了以下算法類型:
分類算法基于數據集中的其他屬性預測一個或多個離散變量。分類算法的一個示例是 Microsoft 決策樹算法。
回歸算法基于數據集中的其他屬性預測一個或多個連續變量,如利潤或虧損。回歸算法的一個示例是 Microsoft 時序算法。
分割算法將數據劃分為組或分類,這些組或分類的項具有相似屬性。分割算法的一個示例是 Microsoft 聚類分析算法。
關聯算法查找數據集中的不同屬性之間的相關性。這類算法最常見的應用是創建可用于市場籃分析的關聯規則。關聯算法的一個示例是 Microsoft 關聯算法。
順序分析算法匯總數據中的常見順序或事件,如 Web 路徑流。順序分析算法的一個示例是 Microsoft 順序分析和聚類分析算法。
為特定的業務任務選擇正確的算法很有挑戰性。您可以使用不同的算法來執行同樣的業務任務,每個算法會生成不同的結果,而某些算法還會生成多種類型的結果。例如,您不僅可以將 Microsoft 決策數算法用于預測,而且還可以將它用作一種減少數據集的列數的方法,因為決策樹能夠識別出不影響最終挖掘模型的列。
算法不必獨立使用,在一個數據挖掘解決方案中可以使用一些算法來探析數據,而使用其他算法基于該數據預測特定結果。例如,可以使用聚類分析算法來識別模式,將數據細分成多少有點相似的組,然后使用分組結果來創建更好的決策數模型。可以在一個解決方案中使用多個算法來執行不同的任務,例如,使用回歸樹算法來獲取財務預測信息,使用基于規則的算法來執行市場籃分析。
挖掘模型可以預測值、生成數據摘要并查找隱含的相關性。為幫助您選擇用于數據挖掘解決方案的算法,下面給出了可為特定的任務使用哪些算法的建議。
任務/可使用的 Microsoft 算法
1)預測離散屬性。例如,預測目標郵件活動的收件人是否會購買某個產品。 / Microsoft 決策樹算法
Microsoft Naive Bayes 算法 Microsoft 聚類分析算法 Microsoft 神經網絡算法 (SSAS)
2)預測連續屬性。例如,預測下一年的銷量。 / Microsoft 決策樹算法 Microsoft 時序算法
3)預測順序。例如,執行公司網站的點擊流分析。 / Microsoft 順序分析和聚類分析算法
4)查找交易中的常見項的組。例如,使用市場籃分析來建議客戶購買其他產品。 / Microsoft 關聯算法
Microsoft 決策樹算法
5)查找相似項的組。例如,將人口統計數據分割為組以便更好地理解屬性之間的關系。 / Microsoft 聚類分析算法
Microsoft 順序分析和聚類分析算法
因為各個模型返回不同類型的結果,所以 Analysis Services 為每個算法提供單獨的查看器。在 Analysis Services 中瀏覽挖掘模型時,該模型會使用模型的相應查看器,顯示在數據挖掘設計器的"挖掘模型查看器"選項卡上。
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com