男同gay片av网站,美女视频黄8频美女视频,男人j放进女人p全黄,柠檬福利精品视频导航,免费涩情网站

首頁
手機(jī)版
熱門搜索:
當(dāng)前位置:電腦軟件應(yīng)用軟件辦公軟件易明建模

易明建模 官方版v20220420

  • 大?。?17MB
  • 語言:簡體中文
  • 類別:辦公軟件
  • 類型:免費(fèi)軟件
  • 授權(quán):國產(chǎn)軟件
  • 時(shí)間:2022/06/15
  • 官網(wǎng):http://goqiche.cn
  • 環(huán)境:Windows7/Windows10/Windows All

相關(guān)軟件

易明建模是一鍵式智能數(shù)據(jù)建模工具,建模流程完全自動(dòng)進(jìn)行。一鍵式建模,又快又好!無需數(shù)據(jù)科學(xué)家即可建模。傳統(tǒng)的手工建模有著諸多的缺點(diǎn),并且效率很低,比如:探索數(shù)據(jù)、數(shù)據(jù)噪音、時(shí)間特征、高基數(shù)變量、模型需求多、如何有效評(píng)估模型、非正態(tài)分布、標(biāo)準(zhǔn)化、LR, RF,GBDT…..使用哪種算法、項(xiàng)目周期長、缺失值、參數(shù)配置等等。智能建模改變應(yīng)用模式:業(yè)務(wù)用戶主導(dǎo),應(yīng)用過程中隨時(shí)隨地建模。

易明建模圖片1

軟件功能

【數(shù)據(jù)源】

1. 本地?cái)?shù)據(jù)文件

智能建模支持txt、csv等格式的數(shù)據(jù)文件。

選擇文件后,可以定義數(shù)據(jù)文件的參數(shù)配置。

下一步,可以定義變量類型、日期格式和選出狀態(tài)。

2. 數(shù)據(jù)庫

在數(shù)據(jù)源窗口中,可以定義JDBC和ODBC兩種數(shù)據(jù)源連接。

【數(shù)據(jù)探索】

1. 基本特征

導(dǎo)入數(shù)據(jù)以后,顯示了數(shù)據(jù)的基本特征:

目標(biāo)變量是Survived(需要用戶設(shè)置),有12個(gè)變量,891條記錄。

自動(dòng)解析了各個(gè)變量的類型和推薦的選出狀態(tài)。

2. 離散變量統(tǒng)計(jì)

離散變量包括單值變量、二值變量和分類變量。

缺失率:缺失值在全部數(shù)據(jù)中的占比。

勢:離散變量可取值集合的成員數(shù)量。

餅圖直觀顯示了各分類的占比。

易明建模圖片2

【預(yù)處理】

1. 自動(dòng)預(yù)處理

智能建模的預(yù)處理過程集成在建模的流程中,一鍵式自動(dòng)預(yù)處理。

2. 預(yù)處理報(bào)告

建模結(jié)束后可以導(dǎo)出模型報(bào)告,描述了預(yù)處理執(zhí)行了哪些動(dòng)作。

3. 預(yù)處理流程

(1)檢查變量值域

檢查并記錄所有變量的值域,若測試數(shù)據(jù)出現(xiàn)訓(xùn)練數(shù)據(jù)沒有的分類或者超出數(shù)值范圍,進(jìn)行針對(duì)性的處理。

(2)時(shí)間日期變量處理

檢查所有時(shí)間日期型變量,創(chuàng)建若干常用的衍生變量。并檢測時(shí)間日期變量的關(guān)聯(lián)性,創(chuàng)建多日期聯(lián)動(dòng)的衍生變量。

(3)缺失值信息提取

若數(shù)據(jù)存在缺失值,提取并記錄缺失值模式,將缺失值所表現(xiàn)出的行為特征轉(zhuǎn)換為衍生變量加以利用。

(4)缺失值填補(bǔ)

若數(shù)據(jù)存在缺失值,利用簡單或個(gè)性化智能算法,填補(bǔ)缺失值。

(5)分類變量降噪

針對(duì)分類變量可能存在的噪音,例如極少數(shù)分類,異常分類,疑似錯(cuò)誤分類等情況,進(jìn)行針對(duì)性處理。

(6)分類變量數(shù)值化

將分類變量轉(zhuǎn)換為可正常進(jìn)行運(yùn)算的數(shù)值型變量。主要方式是dummy variable和平滑化,由算法智能判斷。

易明建模圖片3

(7)糾偏

針對(duì)部分存在正態(tài)性假設(shè)的模型,對(duì)高偏態(tài)變量進(jìn)行數(shù)學(xué)變換,使偏度回到0附近,滿足模型假設(shè)。

(8)異常值處理

探測并識(shí)別可能存在的異常值,并進(jìn)行針對(duì)性處理。

(9)變量篩選

以較寬松的門檻,剔除掉對(duì)建模無用的變量,降低時(shí)間成本和模型復(fù)雜度。

(10)標(biāo)準(zhǔn)化/歸一化

數(shù)據(jù)標(biāo)準(zhǔn)化/歸一化,消除口徑差異。有利于神經(jīng)網(wǎng)絡(luò)等模型的尋優(yōu)求解。

(11)平衡樣本

對(duì)于二分類數(shù)據(jù),若正負(fù)樣本比例嚴(yán)重不均衡,會(huì)按照指定的比例配平,并智能重采樣建模。

易明建模圖片4

4. 手動(dòng)預(yù)處理

選擇變量

根據(jù)變量類型去除一些無關(guān)的變量。例如ID和長文本,沒有缺失值的單值變量等。

衍生變量

用變量姐妹、配偶數(shù)量"SibSp"和 變量父母、子女?dāng)?shù)量"Parch"相加得到家庭成員數(shù)量"Family"??梢钥吹郊彝コ蓡T在1-3人時(shí)幸存率較高。

預(yù)處理選項(xiàng)

在模型選項(xiàng)中可以定義是否數(shù)據(jù)預(yù)處理和是否智能填補(bǔ)。

如果數(shù)據(jù)已經(jīng)進(jìn)行過預(yù)處理,可以取消數(shù)據(jù)預(yù)處理。

智能填補(bǔ)可以更好的對(duì)缺失值進(jìn)行補(bǔ)缺,但是會(huì)消耗更多的硬件資源和時(shí)間,當(dāng)數(shù)據(jù)量很大時(shí)不建議智能填補(bǔ)。不勾選時(shí)會(huì)進(jìn)行簡單填補(bǔ)。

更新內(nèi)容

python版本升級(jí)到3.9

升級(jí)依賴包兼容性到最新版

修復(fù)ubuntu24.04環(huán)境下無法打開建模ide的問題

修復(fù)個(gè)別模型異常調(diào)用cuda的問題

優(yōu)化性能,修復(fù)潛在bug

標(biāo)簽: 數(shù)據(jù)分析 數(shù)據(jù)建模

數(shù)據(jù)分析是在各行各業(yè)都非常重要的環(huán)節(jié),通過數(shù)據(jù)分析工具,可以將有用的信息提取出來,對(duì)其進(jìn)行統(tǒng)計(jì)和處理,并且可以數(shù)據(jù)可視化,從而更加便捷的將其展示出來。那么數(shù)據(jù)分析軟件哪個(gè)最好用呢,在這里小編給大家整理了市面上主流的數(shù)據(jù)分析工具。

網(wǎng)友評(píng)論

返回頂部