支持關系型數據庫、文件(txt/CSV/Excel/JSON…)、分布式大數據框架(HDFS/HBASE/HIVE…)以及通過集成第三方數據讀取方法支持諸如時間序列、web數據、圖數據等多種類型的數據源,方便企業各類數據的接入,為數據分析提供豐富的數據源
提供豐富的數據探查與圖形化展示功能,包括數據取值分布、集中趨勢度量、離散程度度量、偏態峰態度量、空值探查等。通過參數化配置支持數據分區,如訓練集校驗集劃分,統計抽樣等。提供數據項的各種預處理功能,如行過濾、行轉化、列過濾、列轉化、數據聚合和分組、數據分箱、shuffle、sorter、標準化、子集匹配、表維度提取、表規格提取、表轉置等。通過接入其他語言(Python/R/JAVA…)代碼模塊支持用戶自定義的各種數據預處理功能
提供各種數據統計分析功能,包括基本數據統計、相關性分析、方差分析、相似度統計、參數估計、假設檢驗、主成分及因子分析、時間序列分析等。提供各種統計圖表的數據可視化及配色定義等自定義功能,包括高亮表、箱型圖、柱狀圖、折線圖、餅圖、散點圖、提升圖等,支持通過接入第三方圖形化插件擴展數據可視化圖表類別
提供各種數據挖掘功能。包括:回歸分析,如線性回歸、對率回歸、多元回歸、逐步回歸、嶺回歸、Lasso回歸等。分類,如貝葉斯分類、決策樹分類、SVM分類、RF分類、GBDT、AdaBoost、Bagging分類、線性判別分類、K近鄰分類、XGBoost等。聚類,如K-Means、DBSCAN、層次聚類等。頻繁模式挖掘,如Apriori、FPGrowth等。推薦,如協同過濾、序列分析等
通過定義人工神經網絡結構提供各種深度學習功能。包括:CNN、DNN、RNN、LSTM等
通過模型評估工具,用戶可以對開發的數據分析模型的模型效果進行衡量。評估功能包括:交叉驗證、ROC曲線、熵值計分器、數值計分器、濃縮繪圖儀等。支持接入第三方代碼模塊擴展模型評估方法
提供豐富的數據分析結果輸出功能,支持平臺分析結果輸出到目標對象,如文件、數據庫、分布式大數據框架等。提供模型導出功能,支持平臺構建的數據分析流程或模型能夠通過第三方語言(Python/R/JAVA…)等調用。提供數據分析處理流程的流程控制工具,包括自動化執行、循環、開關、錯誤處理等,方便用戶開發的數據分析模型部署應用到實際生產場景中
平臺提供與其他平臺、框架的集成接口,方便集成其他平臺、語言及框架。具體包括:分析處理平臺集成,如weka、MATLAB、SAS、SPSS等。語言集成,如R、Python、JAVA等。分布式大數據框架集成,如Hadoop、spark、kerberos等。機器學習深度學習框架集成,如SK-Learn、TensorFlow等
不論是導入數據、構建數據倉庫,還是制作各類分析展現、數據挖掘等,設計過程完全可視化。遵循便捷易用的設計理念,所有操作無需定義復雜公式,僅需拖拉拽即可快速完成設計,零門檻、上手快。內置上百種可視化元素和統計圖,通過設計與搭配,可衍生出成千上萬種可視化效果。同時還支持動態炫酷的大屏分析,獨特的3D全景視角,自由快捷制作各類交互式常規屏和大屏報表,將創意變成現實
平臺支持數據庫數據源、文本數據源等多種數據源的接入,僅需簡單的拖拽操作便可快速設計復雜格式的報表,報表支持餅圖、折線圖等多種圖形展示并提供報表預覽功能,支持報表導出PDF、EXCEL、WORD等格式
行政執法案件主要以罰款等方式進行行政處罰,處罰決定當事人拒不執行時需要進行強制執行。通過數據分析手段分析何種案件當事人較為配合能夠執行處罰決定,何種案件容易導致當事人拒不執行處罰決定需要被強制執行
強制執行處罰決定的行政執法案件,一方面有可能是由于當事人的原因導致,可以進一步尋找“老賴”當事人或其特征;另一方面有可能是由于案件執法原因導致,如處罰決定不合理,當事人對處罰決定不滿等,可以進一步進行行政執法監督分析;此外,在執法過程中,可以通過模型進行處罰決定執行情況預測,為處罰裁量提供參考依據
行政管理部門的管理職權及其對應的案件根據業務特點可能呈現一些特征規律,如季節性因素等。通過數據分析找出案件發生數量的規律并能夠對未來案件可能發生的數量進行預測
行政執法案件的來源除了群眾舉報外,主要依靠管理部門的例行檢查發現。較為準確的預測未來案件可能發生的數量,能夠為制訂更為合理的檢查計劃,更合理的配置檢查力量提供參考依據
對低保家庭是否能夠生活自理進行統計分析。低保家庭是否能夠生活自理統計分析一方面能夠為民政業務辦理及管理提供當前低保家庭生活自理狀況的宏觀情況;另一方面能夠為進一步的數據分析,如退保情況和生活自理情況關聯分析提供依據