SPM 數(shù)據(jù)挖掘預(yù)測分析軟件是由美國 Salford Systems 公司開發(fā)的以**的機(jī)器 學(xué)習(xí)算法為**的預(yù)測分析工具。
1. SPM 數(shù)據(jù)挖掘預(yù)測分析軟件的主要模塊說明:
CART(分類和回歸樹)是一基于斯坦福大學(xué)和加州大學(xué)伯克利分校的統(tǒng) 計(jì)學(xué)家 Leo Breiman、Jerome Friedman、Richard Olshen 和 Charles Stone 開發(fā)的原 CART 代碼的決策樹軟件。CART 具有高速、精確和容易 使用的特點(diǎn),并自動(dòng)對數(shù)據(jù)提供深入的探索研究,產(chǎn)生高度可理解的預(yù)測 模型。
TreeNet 是新一代高速,錯(cuò)誤容忍,并具有**常精確性的預(yù)測建模工具。 TreeNet 僅需要較少的數(shù)據(jù)準(zhǔn)備工作,巧妙的處理有缺陷的數(shù)據(jù),自動(dòng)適 應(yīng)缺失領(lǐng)域,并且進(jìn)行廣泛的自檢,使得模型應(yīng)用于新數(shù)據(jù)時(shí)的效果也得 到保證。TreeNet 模型經(jīng)常由 500 或更多的小決策樹組成。清晰的圖表概 括了每個(gè)關(guān)鍵變量對于結(jié)果的影響。
GPS 算法
廣義路徑追蹤 (GPS)算法是對傳統(tǒng)線性回歸的一次性提升。GPS 是利用機(jī)器學(xué)習(xí)的方法建立數(shù)百,甚至上千個(gè)候選線性模型,然后自動(dòng)選 擇出其中較優(yōu)的模型。模型效果會(huì)比傳統(tǒng)線性回歸提升很多。這個(gè)算法在 其它任何主流的數(shù)據(jù)挖掘產(chǎn)品中都沒有提供
Data Binning(變量快速自動(dòng)化分組)
變量離散化工作對于數(shù)據(jù)挖掘項(xiàng)目成功至關(guān)重要,而這個(gè)過程通常需要 許多手動(dòng)處理工作,因此非常耗費(fèi)時(shí)間。智能變量分組能夠高度自動(dòng)化的 對變量進(jìn)行智能化的分組,大幅度減少手動(dòng)工作,提升建模效率和模型性 能。
Quick Impute(變量缺失值自動(dòng)化填補(bǔ))
變量的缺失值填補(bǔ)工作一直以來需要大量的手動(dòng)工作。本功能模塊能夠 利用自動(dòng)化對變量的缺失值進(jìn)行快速填補(bǔ),使得缺失值處理輕而易舉,瞬間即可完成之前需要大量手動(dòng)介入的缺失值填補(bǔ)工作。此模塊包含兩種缺 失值自動(dòng)化填補(bǔ)方式,**種方式是經(jīng)典的均值、中位數(shù)、眾數(shù)的填補(bǔ)方 式,另外一種較為智能的方式是利用預(yù)測模型對缺失值進(jìn)行個(gè)性化的填補(bǔ)。
Logistic Regression(邏輯回歸)
提供經(jīng)典的邏輯回歸算法,可以與 TreeNet 結(jié)合使用,快速建立高精度的 邏輯回歸模型。
Regression(線性回歸)
經(jīng)典的較小二乘線性回歸模型。結(jié)合自動(dòng)化功能,可迅速進(jìn)行單一變量 的線性相關(guān)性測。結(jié)合 TreeNet 模型,可快速開發(fā)精確的回歸模型。
2. SPM8 的優(yōu)勢和特點(diǎn):
1. 高精度。雖然已有開源和其它的商業(yè)軟件根據(jù) Jerome H. Friedman 的論文實(shí)現(xiàn)了 GBM 算法,但在算法實(shí)現(xiàn)細(xì)節(jié)上會(huì)與 Friedman 的版本存 在差異,因此在精度上也會(huì)有所差異。TN(TreeNet)是一由 GBM 發(fā) 明人源代碼開發(fā)而成,歷經(jīng) Salford Systems 十幾年來的不斷迭代優(yōu)化, 使用者*對 GBM 內(nèi)部算法有深入了解,就能通過簡單操作獲得高精度 的模型。在開源軟件中,使用者要對算法細(xì)節(jié)有非常深入的了解,不斷對 GBM 進(jìn)行調(diào)試才可能獲得接近 TN 模型的精度。而在 SAS EM 中實(shí)現(xiàn)的 GBM 無論在運(yùn)行速度和精度上都與 TN 存在差距。根據(jù)中國建設(shè)銀行數(shù)據(jù) 分析中心較近的測試結(jié)果,在 KDD2009 比賽公開數(shù)據(jù)集上,如果對所有 15000 個(gè)變量進(jìn)行建模,SAS EM 的 GBM 會(huì)出現(xiàn)崩潰死機(jī)的情況,而且將 TN 篩選后的 100 多個(gè)變量在 SAS 內(nèi)運(yùn)行后得到的模型 AUC 僅為 0.62, 而在 TN 中可到達(dá) 0.9 左右。
2. 高緯度特征快速篩選。SPM 中的 TreeNet 是目前較快的 GBM 算法。 非常適合高緯度快速變量篩選。同時(shí) SPM 中的 GPS 是目前較快速的正則 化回歸算法,支持廣譜正則化路徑搜索策略(包含 Ridge, Lasso 以及 Compact),可作為快速衍生特征篩選的重要工具。
3. 友好的用戶界面,提供強(qiáng)大的自動(dòng)化建模。SPM 用戶界面設(shè)計(jì)簡潔明 了,操作簡單,*比較強(qiáng)的專業(yè)背景就可以輕松使用。SPM 中的 AUTOMATE 自動(dòng)化建模技術(shù)可輕松完成兩大**功能:自動(dòng)化模型優(yōu)化 以及機(jī)器學(xué)習(xí)模型的置信度檢驗(yàn)。
4. 熱點(diǎn)追蹤。非常適合于信用風(fēng)險(xiǎn)和反欺詐場景。通過 CART 調(diào)整 PRIOR 設(shè)置來進(jìn)行熱點(diǎn)追蹤,大范圍搜索各種可能的規(guī)則集,快速識別關(guān)注人群 的特征,對傳統(tǒng)邏輯回歸模型可產(chǎn)生有效補(bǔ)充。
5. 新穎的聚類和異常點(diǎn)分析。CART 巧妙利用監(jiān)督學(xué)習(xí)算法進(jìn)行無監(jiān)督 學(xué)習(xí)。CART 可給出了解釋性很強(qiáng)的規(guī)則形式的聚類;利用 CART 中的 AUTOMATE UNSUPERVISED 夠找到樣本中的異常點(diǎn),可被用于反欺詐等 場景。
6. 快速邏輯回歸模型開發(fā)。SPM 提供兩種快速邏輯回歸模型開發(fā)方式, 大幅度降低手動(dòng)工作。**種方法是首先通過 TreeNet 進(jìn)行變量篩選,然 后利用 Spline 對原始變量進(jìn)行快速變形,然后再將變形過后的衍生變量 放入邏輯回歸就能得到捕捉非線性信號的邏輯回歸模型,通常這樣的模型 比利用手動(dòng)分組得到的邏輯回歸模型較加精確。*二種方法是利用 Data Binning 將變量快速進(jìn)行自動(dòng)化分組,然后將分組后的數(shù)據(jù)集直接導(dǎo)入 GPS,即可得到特征篩選后的邏輯回歸模型,可作為邏輯回歸模型開發(fā)的 基準(zhǔn)參考模型。
3. SPM 給客戶帶來的**
較低的使用門檻
幫助企業(yè)應(yīng)對大數(shù)據(jù)人力資源問題。熟練掌握 R、Python、SAS 建模編程能力的大數(shù)據(jù)分析人員國應(yīng)匱乏,人才成本水漲船高!SPM 高度自動(dòng)化、智能化的使用方式大幅度降低了建模人 員的門檻!*編程,*深厚的建模理論基礎(chǔ)和經(jīng)驗(yàn),經(jīng)過較 短時(shí)間的訓(xùn)練就能建立*級的模型!
較高的大數(shù)據(jù)分析效率
面對越來越龐大的數(shù)據(jù)量,以及日益復(fù)雜的數(shù)據(jù)分析任務(wù),建模 人員希望能夠有高度自動(dòng)化的分析技術(shù)來幫助他們從繁瑣低效 的手動(dòng)工作中解放出來
SPM 建模工具的內(nèi)核算法非常巧妙,能夠顯著減少建模人員在 數(shù)據(jù)預(yù)處理方面的工作量(數(shù)據(jù)預(yù)處理在建模時(shí)會(huì)占用分析人員 幾乎 80%以上的時(shí)間)
高效快速的分析技術(shù)將使得組織具有較快的應(yīng)變能力
建模人員能夠在相同時(shí)間內(nèi)完成更多高質(zhì)量的建模任務(wù),節(jié)約人 力成本,并且把更多精力花在商業(yè)問題的理解和定義、新數(shù)據(jù)源 的獲取、構(gòu)建衍生新特征以及設(shè)計(jì)策略等較加有**的創(chuàng)意性工作上
較精確的模型
識別更多高風(fēng)險(xiǎn)客戶,尋找到更多具有的客戶
較加精準(zhǔn)的進(jìn)行客戶關(guān)系維護(hù)(比如較加準(zhǔn)確的預(yù)測即將流失的 客戶)
SPM 的較佳模型通常比*使用經(jīng)典統(tǒng)計(jì)技術(shù)建立的模型性能 高 5%到 15%。只要有可能,高性能的模型顯然較加有吸引 力!SPM 建立的較佳機(jī)器學(xué)習(xí)模型通常能夠接近給定數(shù)據(jù)的極限 預(yù)測精度,因此可作為 benchmark,對別的模型進(jìn)行性能對比評測!
北京天演融智軟件有限公司(科學(xué)軟件網(wǎng))是SPM軟件在中國的授權(quán)經(jīng)銷商,為中國的軟件用戶提供優(yōu)質(zhì)的軟件銷售和培訓(xùn)服務(wù)。
詞條
詞條說明
Earth Volumetric Studio(EVS) 環(huán)境可視化和挖掘可視化系統(tǒng)介紹
Earth Volumetric Studio整合了Environmental Visualization System和Mining Visualization System的功能,集合了EnterVol多年的開發(fā)技術(shù)。Earth Volumetric Studio在新的用戶友好的環(huán)境中保留了原有的模塊化工具包。Earth Volumetric Studio是一個(gè)獨(dú)立的Windows程序,它運(yùn)行
在社會(huì)研究等領(lǐng)域,研究數(shù)據(jù)往往具有層次結(jié)構(gòu)。也就是說,單獨(dú)研究的課題可能會(huì)被分類或重新劃分到具有不同特性的組中。在這種情況下,個(gè)體可以被看成是研究的**層(level-1)單元,而那些區(qū)分開他們的組也就是*二層(level-2)單元。這可以被進(jìn)一步的延伸,*二層(level-2)的單元也可以被劃分到*三層單元中,*三層(level-3)單元的也可以劃分到*四層單元中。這方面的例子比比皆是,比如教育
PS和瞬態(tài)研究的應(yīng)用**培訓(xùn)
PS 2023年較新培訓(xùn)主題新鮮出爐了,本次由于培訓(xùn)需求的增加,所以此次課程將提供2種培訓(xùn)形式,您可以選擇您感興趣的培訓(xùn)形式參加!詳情登陸:科學(xué)軟件網(wǎng)—培訓(xùn)—收費(fèi)培訓(xùn)課程安排主題:Applications?of?PS?&?Transient?Studies日期:January?24,?25,?26,?
2020年10月16日下午4點(diǎn),MAXQDA軟件系列講座正式開講,主講老師是寧海芹老師,寧老師是MAXQDA軟件專業(yè)培訓(xùn)師、德國柏林洪堡大學(xué)在讀博士,研究領(lǐng)域?yàn)?*與比較教育、質(zhì)性資料分析。從2015年起開始使用MAXQDA,將MAXQDA應(yīng)用于研究項(xiàng)目和學(xué)位論文的數(shù)據(jù)分析和撰寫,并多次擔(dān)任MAXQDA在線研討會(huì)的講師,在MAXQDA的教學(xué)和使用方面積累了豐富的經(jīng)驗(yàn)。講座開始本次課程是MAXQDA
公司名: 北京天演融智軟件有限公司
聯(lián)系人: 張經(jīng)理
電 話:
手 機(jī): 18610814366
微 信: 18610814366
地 址: 北京海淀海淀上地東路35號院1號樓3層1-312318、1-312-319
郵 編:
網(wǎng) 址: turntech88.b2b168.com
公司名: 北京天演融智軟件有限公司
聯(lián)系人: 張經(jīng)理
手 機(jī): 18610814366
電 話:
地 址: 北京海淀海淀上地東路35號院1號樓3層1-312318、1-312-319
郵 編:
網(wǎng) 址: turntech88.b2b168.com
智能云閱卷機(jī) 高速閱讀機(jī) 讀卡機(jī)怎么識別答題卡
¥13800.00