性能監控和提升機制:K-Fusion提供了流程和節點兩個級別的性能監控日志功能,能夠以不同的粒度記錄每次流程執行過程中重要信息,例如讀、寫、輸入、輸出、更新、刪除的數據行數,節點的每秒處理的數據行數、整個流程每秒處理的數據行數;并且對信息進行可視化以便用戶快速定位性能瓶頸。實現了多種用于流程性能提升的機制,例如在流程處理過程中對數據進行分片處理,并通過設置流程處理節點的冗余實現對這些分片數據的并行處理和負載均衡;對大文本的讀寫實現并行化;對常用的關系型數據庫目的端進行Bulk Insert方式的批量數據加載。通過以上機制,顯著降低大數據量情況的抽取、轉換和加載時間,提高了用戶數據集成工作的效率。
流程控制能力和異常處理完善:K-Fusion支持對多個ETL流程間相對執行順序的控制,除了提供了流程串行的方式外,提供了多流程的并行執行方式以獲得執行效率的最大化,另外還可延遲或者中斷指定節點或者子流程的執行。對流程執行過程中可能存在的異常,支持異常處理流程的自定義,例如定制“日志記錄”、“郵件通知”或“異常數據歸檔”,以提高實際部署環境中,用戶ETL流程的容錯性。