BDA數據分析職業(yè)技能等級規(guī)范
———————————————————————————————————
CMRA & 中經數(北京)數據應用技術研究院
目??次
前?言................................................................................. 2
1 范圍................................................................................ 3
2 術語和定義.......................................................................... 3
3 職業(yè)技能等級劃分與要求.............................................................. 3
4 職業(yè)能力要求........................................................................ 5
5 培訓要求........................................................................... 10
6 鑒定要求........................................................................... 10
7 證書管理........................................................................... 11
前??言
本標準按照GB/T 1.1-2009給出的規(guī)則起草。
本標準由中經數(北京)數據應用技術研究院提出并歸口。
本標準起草單位:中國信息協(xié)會市場研究業(yè)分會,臺灣人工智慧發(fā)展學會,山東省大數據研究會,中經數(北京)數據應用技術研究院,中國聯通智慧足跡數據科技有限公司,河北經貿大學,天津商業(yè)大學,天津財經大學,陜西樂觀數據科技有限責任公司?!?/span>
本標準主要起草人:王磊,李春林,張良,翁瑞光,安建業(yè),扈瓊玲,姜澍,張巖,石玉峰,王鍵,楊春河,云霞。
本標準為首次發(fā)布。
聲明:本標準的知識產權歸屬于中經數(北京)數據應用技術研究院,未經研究院同意,不得印刷、銷售。任何組織、個人使用本標準開展認證、檢測等活動應經研究院批準授權。
BDA數據分析職業(yè)技能等級規(guī)范
1 范圍
本標準規(guī)定了BDA數據分析職業(yè)技能的術語和定義、職業(yè)技能等級劃分與要求、職業(yè)能力要求、培訓要求和鑒定要求。
本標準適用于BDA數據分析職業(yè)技能等級認證的考核與評估,數據分析從業(yè)人員的聘用和培訓等。
2 術語和定義
2.1
數據分析 Data Analysis
數據分析是指用適當的統(tǒng)計分析方法對收集來的大量數據進行分析研究和概括總結,提取有用信息和形成結論的過程。在實用中,數據分析可幫助人們做出判斷,其研究結論可以用于決策支持。因此數據分析也是決策支持中的重要環(huán)節(jié)。常用的分析方法有假設檢驗、多元分析、時序分析、調查分析等。
2.2
數據挖掘 Data Mining
數據挖掘是一個利用各種分析方法,從大量數據中提取隱含和潛在的、對決策有用的信息和知識的過程。數據挖掘的主要流程包括:問題與數據理解、數據準備、模型建立、模型評估、結論發(fā)布與應用。
2.3
數據洞察 Data Insight
數據洞察是利用數據分析或數據挖掘得到的知識,結合問題背景領域的知識理解,告訴人們如何選擇,或者怎樣的選擇會導致怎樣的結果,包括決策運營、預測機會等。數據洞察是對分析結論的升華,具有很強的指向性。
3 職業(yè)技能等級劃分與要求
3.1 等級劃分
BDA數據分析職業(yè)技能劃分為五個等級:
——員級;
——初級;
——中級;
——準高級;
——高級。
3.2 主要職責
3.2.1 數據管理員
主要職責是辦公自動化、數據收集基本技能。
3.2.2 初級數據分析師
主要職責是辦公自動化、數據收集基本技能;具備基本的數據處理、分析和展示能力。
3.2.3 中級數據分析師
主要職責是具備數據處理、分析和展示能力;具備基本的網絡數據收集、數據挖掘能力,具備和大型數據庫管理人員、大數據框架工程師團隊協(xié)同工作的能力。
3.2.4 準高級數據分析師
主要職責是具備網絡數據收集、數據挖掘能力;具備大規(guī)模數據處理、分析和展示能力;具備協(xié)助高級數據分析師工作的能力。
3.2.5 高級數據分析師
主要職責是具備網絡數據收集技能、數據挖掘能力;具備大規(guī)模數據處理、分析和展示能力;具備承擔大數據項目設計和實施能力。
3.3 職業(yè)等級類別
3.3.1 員級
中職畢業(yè)(含在校生),經培訓考核成績合格。
3.3.2 初級
??埔陨蠈W歷(含在校生),或從事相關工作,經考核成績合格。
3.3.3 中級
本科以上學歷(含在校生),或取得初級證書且從事相關工作1年以上,經考核成績合格。
3.3.4 準高級
碩士以上學歷(含在校生),或取得中級證書且連續(xù)從事相關工作2年以上(含2年),經考核成績合格。
3.3.5 高級
博士學歷,或碩士學歷且取得準高級證書后連續(xù)從事相關工作3年以上(含3年),或連續(xù)從事相關工作5年以上且具有項目管理經驗,經答辯成績合格。
4 職業(yè)能力要求
4.1 數據管理員職業(yè)能力
數據管理員職業(yè)能力要求,見表1。
表1 數據管理員職業(yè)能力要求
職業(yè)
功能
|
工作內容
|
技能要求
|
相關知識
|
基本
素養(yǎng)
|
職業(yè)道德與安全意識
|
1.能遵守職業(yè)道德
2.能遵守涉及的數據安全和保密要求及規(guī)定
|
1.了解職業(yè)道德的知識和應用
2.了解數據安全和保密要求的知識及規(guī)定
|
辦公
自動
化
|
數據與結論的可視化展示
|
1.能運用Excel軟件管理數據
2.能運用PPT美化和展示分析結論
3.能熟練運用辦公軟件進行文檔編輯排版等工作
|
1.掌握辦公軟件(word、excel、ppt等)的相關知識及應用
|
數據
管理
|
數據收集
|
1.能收集互聯網上的數據
2.能通過調查活動收集數據
|
1.掌握互聯網上公開數據的來源和采集方法
2.了解調查數據采集的基本要求和流程
|
數據處理
|
1.能預處理結構化數據
2.能完成數據抽取、清理轉換、格式化數據
|
1.了解數據的基本結構
2.了解數據預處理的相關方法及應用
3.理解數據集成、數據審核、數據清理和數據轉換方法
|
4.2 初級職業(yè)能力
初級職業(yè)能力要求,見表2。
表2 初級職業(yè)能力要求
職業(yè)
功能
|
工作內容
|
技能要求
|
相關知識
|
基本
素養(yǎng)
|
職業(yè)道德與安全意識
|
1.能遵守職業(yè)道德
2.能遵守涉及的數據安全和保密要求及規(guī)定
|
1.了解職業(yè)道德的知識和應用
2.了解數據安全和保密要求的知識及規(guī)定
|
數據
管理
|
數據收集
|
1.能收集互聯網上的數據
2.能收集外部的公開或非公開數據
3.能收集內部的數據
4.能通過調查活動收集數據
|
1.掌握互聯網上公開數據的來源和采集方式
2.理解抽樣調查及社會調查方法的基本知識及應用
3.掌握非公開數據和內部數據的采集方法
|
數據處理
|
1.能處理結構化與非結構化數據
2.能完成數據抽取、清理轉換、格式化數據
3.能運用常用的數據庫存取數據
|
1.理解數據集成、數據審核、數據清理和數據轉換的基本方法
2.理解均值插補、回歸插補、相似值插補等常用缺失值插補方法
3.了解數據結構及數據庫的基本原理
4.了解分布式文件系統(tǒng)數據存取機理
|
數據
分析
|
數據分析
|
1.能根據業(yè)務問題選擇數據分析方法
2.能運用各類數據分析方法進行數據分析
|
1.掌握統(tǒng)計學基礎、數據分析方法基礎
2.運用描述性分析、推斷性分析、方差分析、線性回歸分析等方法分析數據
|
數據分析工具的應用
|
1.能運用R、Excel、SPSS、SAS等某一數據分析工具
|
1.掌握基于R、Excel、SPSS、SAS等某一數據分析軟件掌握數據分析的相關方法及應用
|
可視
化設
計與
報告
寫作
|
數據可視化展示
|
1.能通過程序語言或工具展示數據情況
2.能選擇合適圖型展示復雜數據
3.能運用Excel軟件展示數據結論
4.能運用PPT美化和展示分析結論
|
1.掌握數據分析軟件的可視化功能及應用
2.掌握辦公軟件(word、excel、ppt等)的相關知識及應用
|
撰寫報告
|
1.能根據分析結論提出合理建議和撰寫報告
2.能熟練運用辦公自動化軟件編輯報告文檔
|
1.掌握數據分析報告的撰寫要求
2.掌握調查分析報告的撰寫要求
|
4.3 中級職業(yè)能力
中級職業(yè)能力要求,見表3。
表3 中級職業(yè)能力要求
職業(yè)
功能
|
工作內容
|
技能要求
|
相關知識
|
基本
素養(yǎng)
|
職業(yè)道德與安全意識
|
1.能遵守職業(yè)道德
2.能遵守涉及的數據安全和保密要求及規(guī)定
|
1.了解職業(yè)道德的知識和應用
2.了解數據安全和保密要求的知識及規(guī)定
|
業(yè)務
分析
|
定義業(yè)務問題
|
1.能將業(yè)務目標轉化為數據分析目標
2.能分析業(yè)務對應產品的分類和服務模式
3.能分析業(yè)務運營模式及系列結構
4.能分析相當業(yè)務計算機管理系統(tǒng)
|
1.了解項目分析的知識和方法
2.了解相關業(yè)務領域基本知識
|
數據
管理
|
數據庫
管理
|
1.能分析和評估不同場景的數據庫應用
2.能搭建企業(yè)常用數據庫
3.能對多數據庫操作管理
4.能優(yōu)化數據庫
|
1.了解多款數據庫的特性及優(yōu)缺點
2.了解Hadoop生態(tài)圈上的Hbase、Hive、Impala的基本功能
3.了解數據庫的索引機制、查詢優(yōu)化機制、存儲機制,表分區(qū)應用等
4.掌握數據庫的創(chuàng)建與管理、視圖、索引以及備份與恢復等方法
|
數據
預處理
|
1.能制定不同來源數據收集方案
2.能拼接不同來源不同類型的數據
3.能處理丟失或損壞的數據
4.能從海量數據中搜集并提取信息
5.能完成數據抽取、清理轉換、重構整合和格式化數據
|
1.了解大數據的基本理論與應用
2.掌握數據集成、數據審核、數據清理和數據轉換的基本方法
3.掌握均值插補法、回歸插補法、相似值插補方法等常用缺失值插補方法,
4.了解EM插補法、多重插補法和基于模型的插補方法
|
數據挖掘與統(tǒng)計機器學習
|
數據挖掘
分析
|
1.能分析數據特征
2.能運用數據挖掘分析方法
3.能分析和處理海量數據
4.能熟練的進行多維度分析
5.能實現特定數據挖掘功能
|
1.掌握數據挖掘相關知識
2.理解統(tǒng)計建模相關知識
3.運用分布分析、對比分析、統(tǒng)計量分析、周期性分析、貢獻度分析、相關性分析等方法
4.運用因子分析、聚類分析、判別分析、對應分析、多元回歸分析、Logistic回歸分析、時間序列分析、結構方程模型等分析方法
5.掌握決策樹、關聯分析、神經網絡等分析方法
6.理解開源的算法代碼
|
模型訓練
與應用
|
1.能創(chuàng)建訓練集、驗證集和測試集
2.能評估模型性能
3.能運用建立好的模型預測業(yè)務問題
4.能實現特定模型功能
|
可視化分析
|
撰寫報告
與可視化數據
|
1.能使用可視化分析的相關工具及相關軟件
2.能理解和掌握可視化分析的算法模型
3.能應用開源軟件進行可視化分析項目
4.能按要求撰寫數據分析報告
|
1.掌握數據分析報告的撰寫要求
2.掌握調查分析報告的撰寫要求
3.掌握python等數據分析工具可視化功能及應用
|
4.4 準高級職業(yè)能力
準高級職業(yè)能力要求,見表4。
表4 準高級職業(yè)能力要求
職業(yè)
功能
|
工作內容
|
技能要求
|
相關知識
|
基本
素養(yǎng)
|
職業(yè)道德與安全意識
|
1.能遵守職業(yè)道德
2.能遵守涉及的數據安全和保密要求及規(guī)定
|
1.了解職業(yè)道德的知識和應用
2.了解數據安全和保密要求的知識及規(guī)定
|
業(yè)務
分析
|
定義業(yè)務問題
|
1.能將業(yè)務目標轉化為數據分析目標
2.能分析業(yè)務對應產品的分類和服務模式
3.能分析業(yè)務運營模式及系列結構
4.能分析相當業(yè)務計算機管理系統(tǒng)
|
1.了解項目分析的知識和方法
2.了解相關業(yè)務領域基本知識
|
數據庫管理
|
數據庫架構設計與特性評估
|
1.能分析評估不同數據庫的特性和優(yōu)缺點
2.能協(xié)助工程師完成數據庫架構設計
3.能協(xié)助ETL工程師工作
|
1.理解在不同場景下數據庫的構建、運維和評估技術
2.了解大規(guī)模并行處理、分布式文件系統(tǒng)、分布式數據庫、分布式計算等大數據平臺的構建和運維技術
3.理解流計算等分析技術
4.理解數據庫運作原理和工具實現方式
|
大數據管理與設計
|
1.能進行數據分析和建模
2.能協(xié)助實踐BI全過程
3.能協(xié)助開發(fā)大數據分析處理系統(tǒng)
|
統(tǒng)計機器學習與深度學習
|
模型與算法的計設、測試和驗證
|
1.模型選擇與評估
2.運用建立好的模型預測業(yè)務問題
3.能靈活對特定的業(yè)務場景進行統(tǒng)計學方法和機器學習方法
4.能理解圖像或語音或文本分析和挖掘方法
|
1.掌握特征提取、異常診斷、模型評估技術和決策樹、關聯分析、支持向量機、神經網絡、貝葉斯網絡等分析方法
2.理解圖像分析,或語音分析,或文本分析方法
3.理解無監(jiān)督學習、有監(jiān)督學習、模式識別、卷積神經網絡等分析方法
4.理解圖像或語音或文本分析的內部機理
|
可視化分析
|
通過源代碼或工具軟件實現可視化分析
|
1.能使用可視化分析相關開源軟件棧和工具
2.能協(xié)助開發(fā)分布式可視化分析系統(tǒng)
|
1.掌握python等數據分析工具可視化功能及應用
2.了解開源的算法代碼編
|
4.5 高級職業(yè)能力
高級職業(yè)能力要求,見表5。
表5 高級職業(yè)能力要求
職業(yè)
功能
|
工作內容
|
技能要求
|
相關知識
|
基本
素養(yǎng)
|
職業(yè)道德與安全意識
|
1.能遵守職業(yè)道德
2.能遵守涉及的數據安全和保密要求及規(guī)定
|
1.了解職業(yè)道德的知識和應用
2.了解數據安全和保密要求的知識及規(guī)定
|
業(yè)務
分析
|
規(guī)劃業(yè)務問題
|
1.能深入了解業(yè)務問題
2.能拆解問題進行結構化
3.能把問題模塊進行細分
4.能夠找出可行的數據分析和建模方式
5.能夠帶領團隊整合管理企業(yè)的數據資產
|
1.了解項目分析的知識和方法
2.了解相關行業(yè)領域知識
3.了解業(yè)務規(guī)劃相關知識
4.熟悉國家有關大數據產業(yè)發(fā)展方針、政策和法規(guī)
|
大數
據管
理
|
數據庫架構設計與特性評估
|
1.能分析評估不同數據庫的特性和優(yōu)缺點
2.能指導對數據庫架構設計
3.能指導ETL工程師業(yè)務工作
|
1.掌握在不同場景下數據庫的構建、運維和評估技術
2.掌握大規(guī)模并行處理、空間數據庫、分布式文件系統(tǒng)、分布式數據庫、分布式計算等大數據平臺的構建和運維技術
3.基本掌握流計算等分析技術
4.理解數據庫運作原理和工具實現方式
|
大數據管理與設計
|
1.能進行數據分析和建模
2.能實踐BI全過程
3.能指導開發(fā)大數據分析處理系統(tǒng)。
|
統(tǒng)計機器學習與深度學習
|
模型與算法的計設、測試和驗證
|
1.能承接算法項目
2.能完成算法設計
3.能選擇與評估模型
4.運用建立好的模型預測業(yè)務問題
5.能靈活對特定的業(yè)務場景進行統(tǒng)計學方法和機器學習方法及算法設計
6.實現圖像或語音或文本分析設計
7.能指導團隊成員深度學習相關技術以及系統(tǒng)的研發(fā)
|
1.運用特征提取、異常診斷、模型評估技術和決策樹、關聯分析、支持向量機、神經網絡、貝葉斯網絡等分析方法
2.掌握圖像分析,或語音分析,或文本分析方法
3.掌握無監(jiān)督學習、有監(jiān)督學習、模式識別等分析方法
4.理解圖像或語音或文本分析的內部機理
|
可視化分析
|
通過源代碼或工具軟件實現可視化分析
|
1.能精通可視化分析相關開源軟件棧和工具
2.能指導開發(fā)分布式可視化分析系統(tǒng)
|
1.掌握python等數據分析工具可視化功能及應用
2.掌握開源的算法代碼編寫經驗
|
團隊溝通協(xié)同與匯報
|
團隊技術溝通
與用戶需求溝通
|
1.能夠與大型數據庫管理人員協(xié)同工作
2.能夠與大數據框架工程師協(xié)同工作
3.根據用戶數據創(chuàng)造不同特性的產品和系統(tǒng)
4.推動業(yè)務落地實現數據分析建議
5.計劃、領導、組織、實施大數據項目工作
|
1.具備項目管理經驗
|
5 培訓要求
5.1 培訓期限
5.1.1 全日制學校教育,根據其培養(yǎng)目標和教學計劃確定期限。
5.1.2 晉級培訓的培訓期限要求如下:
a) 員級24標準學時;
b) 初級48標準學時;
c) 中級60標準學時;
d) 準高級80標準學時。
5.2 培訓教師
5.2.1 培訓初、中級數據分析師的教師應具有BDA數據分析師中級以上職業(yè)證書或中級以上專業(yè)技術職務任職資格。
5.2.2 培訓準高級數據分析師的教師應具有BDA數據分析師高級職業(yè)證書或相應專業(yè)高級專業(yè)技術職務任職資格。
5.3 培訓場地設備
理論培訓應具有可容納30名以上學員的教室,實際操作培訓應有相應的設備、工具、安全設施等較為完善的場地。
6 鑒定要求
6.1 面向人員
從事或準備從事數據分析相關工作的人員。
6.2 鑒定機構
BDA數據分析師由中經數(北京)數據應用技術研究院統(tǒng)一鑒定。鑒定合格者按照等級規(guī)范統(tǒng)一核發(fā)相應等級的《BDA數據分析師證書》,此證書全國通用。
6.3 鑒定方式
6.3.1 初級和中級分析師考核采用理論知識考試和技能操作方式,并遞交實踐報告。
6.3.2 理論知識考試采取閉卷筆試方式,技能操作考核采用實際操作方式。
6.3.3 理論知識考試和技能操作考核均實行百分制,成績均達到60分(含60分)以上者為合格。
6.3.4 高級數據分析師采用報告綜合評審和答辯方式。
6.4 考評員與考生配比
6.4.1 理論知識考試考評人員與考生配比為1:30,每標準教室不少于2名考評員。
6.4.2 技能操作考核考評人員與考生配比為1:30,且不少于2名考評員。
6.4.3 高級數據分析師綜合評審和答辯考評人員不少于3人。
6.5 鑒定時間
6.5.1 理論知識考試150分鐘,技能操作考核150分鐘,答辯20分鐘。
6.5.2 高級數據分析師的答辯時間為45分鐘,其中包含自我陳述15分鐘、答辯30分鐘。
6.6 鑒定場所設備
理論知識考試在標準教室進行,技能操作考核在具有相關的設備、工具和安全設備等較為完善的場地進行。
7 證書管理
7.1 證書分類
《BDA數據分析師證書》分為以下類型:
a) 《數據管理員證書》;
b) 《初級數據分析師證書》;
c) 《中級數據分析師證書》;
d) 《準高級數據分析師證書》;
e) 《高級數據分析師證書》。
7.2 發(fā)證管理
《BDA數據分析師證書》由中經數(北京)數據應用技術研究院統(tǒng)一頒發(fā),實行統(tǒng)一編號登記管理,考生在相應考試機構領取。
7.3 作廢管理
7.3.1 若證書有手寫或拼印,則作廢。
7.3.2 若持證人利用證書發(fā)生觸犯國家法律法規(guī)等違法亂紀行為,一經查實,發(fā)證機構有權聲明作廢該證書。
7.4 證書查真
持證人和用人單位可在BDA數據分析師官網(www.n-bda.org)和微信公眾號隨時公開查真。
————————————————————————
|