倢の䌚瀟の構築デヌタ品質管理

誀った初期デヌタによっお匕き起こされた歎史䞊最も費甚のかかる間違いは、アリアン5ロケットの墜萜であるず考えられおいたす。この事件による被害総額は、1996幎初頭の䟡栌で5億ドルず掚定されおいたす。



もう1぀、おそらく最も興味深いのは、2014幎のフランス囜鉄SNCFからの2,000本の列車の倧量泚文の間違いでした。技術芁件を圢成したチヌムは、数十のステヌションで゚プロンの寞法を個人的に枬定したした。快適さを増したいので、圌らは構図の幅を背䞭合わせに最倧に蚭定したした。圌らはパリの近くで枬定を行いたした-そしお倚くの駅の地域でぱプロンが線路に近いこずを圌らはテスト䞭にすでに孊びたした。間違いの代償は、むンフラストラクチャ党䜓を数億ナヌロで近代化するこずです。圌らは駅の特城を備えたMDMがあるでしょう...



画像



これに続いお、膚倧な数の亀換および銀行の゚ラヌが発生したす。詳现、数、および配眮された株匏の䟡倀のデヌタが正しくないず、数十億ドルの損倱たたは砎産にさえ぀ながりたす。



この蚘事は、「マスタヌデヌタず統合」の蚘事の続きであり、 デヌタの品質管理の問題、䞻にマスタヌデヌタに぀いお詳しく説明しおいたす。この蚘事は、IT゚グれクティブ、アヌキテクト、むンテグレヌタヌ、およびかなり倧芏暡な䌁業で働くすべおの人にずっお特に興味深いものになりたす。



コンテンツ



1.蟞曞、ビゞネスデヌタの皮類マスタヌデヌタ、芏制参照情報、運甚デヌタ。

2.間違いずは䜕かに぀いお簡単に説明したす。

3.DQS゜リュヌションのアヌキテクチャ。

4.゚ラヌを凊理するための技術的および非技術的な方法

4.1。NSI。

4.2。マスタヌデヌタ。

4.3。オペレヌティング・システム。

5.䞊蚘のいずれも圹に立たなかった堎合の察凊方法-DQSを実装したす。

6.そしおどのように責任を分担するのですか



甚語ず問題に既に粟通しおいる堎合は、DQSアヌキテクチャのパヌト3に盎接スキップしおください。



1.蟞曞、ビゞネスデヌタの皮類



ここ数十幎の間、IT゚バンゞェリストはデヌタが新しいオむルであるず私たちに確信させおきたした。どんなビゞネスもそれが所有する情報にたすたす䟝存しおいるこず。分析郚門ずデヌタ郚門は、IT䌁業だけでなく、「図」から可胜な限り産業および産業郚門にも存圚したす。



れネラル゚レクトリックずボヌむングが「デゞタル」子䌚瀟を䜜成し、航空機、タヌビン、発電所などの機噚の所有者から収集した膚倧な量の情報を獲埗する方法の䟋に、すでに倚くの人が悩んでいたす。これらのデヌタにより、機噚の信頌性を高め、起こりうる障害を予枬し、朜圚的な損傷を倧幅に節玄し、最終的には単に人々の呜を救うこずができたす。



デヌタはたすたす増えおおり、その蓄積はビゞネスの成長に非線圢的に䟝存しおおり、成長はそれを䞊回っおいたす。開発の特定の段階前の蚘事の芏暡で玄レベル6〜7にある成長䌁業は、 誀ったデヌタの問題に盎面しおおり、これらの゚ラヌのコストが非垞に高いこずが刀明する堎合が垞にいく぀かありたす。



画像

デヌタの増加に関する埓来の状況は、ほずんどの堎合指数関数的です。



ビゞネスの過皋で、3皮類のデヌタが䌚瀟にずっお特に重芁です。



  • - — , , . , ( : , , ), , , ..;
  • - () — -, . , : () , , , ;
  • 運甚トランザクションデヌタ特定のクラむアントぞの特定の補品の販売の事実、請求曞ず行為、受講したコヌス、宅配䟿の泚文、タクシヌの乗車は、䌚瀟の業務に応じお異なりたす。


NSIをサポヌトする骚栌、静脈ず動脈のマスタヌデヌタず比范できる堎合、オペレヌティングシステムはこれらの静脈を流れる血液です。



ビゞネスデヌタの皮類を区別する必芁があるのは、それぞれが゚ラヌに察凊するための独自のアプロヌチを持っおいるためです。これに぀いおは、以䞋で説明したす。



画像



2.間違いずは䜕かに぀いお簡単に



゚ラヌは避けられず、い぀でもどこでも発生し、明らかに、宇宙自䜓の混沌ずし​​た性質を反映しおいたす。あなたはそれらを䜕か悪いものず芋なし、それらのために動揺するこずができたすが、それに぀いお考えおください間違いは進化の䞭心ですはい、次の各皮は前の皮であり、DNAにいく぀かのランダム゚ラヌがありたす。これらの゚ラヌの結果のみが、特定の条件䞋で有甚であるこずが刀明したした。


ビゞネスが苊しむ䞻なタむプの間違い



  • 人的芁因、人間工孊。あらゆる皮類のタむプミス、混乱したフィヌルド、誀った情報。入力時にアクションや手順を忘れた、たたは誀っお芋逃したカスタマヌカヌドにも50のフィヌルドがありたすか静的に、これは最も可胜性の高いタむプの゚ラヌであるため、それらの頻床ず圱響が最倧になる可胜性がありたす。幞いなこずに、それらず戊うために最も倚くの方法が発明されたした。
  • . , , . , — , . , , . 
 , , ? , , , CRM : ! !
  • 故意の間違い。埓業員は故意に数癟䞇人を自分自身に移したした-そしお姿を消したした。もちろん、これは極端な䟋であり、犯眪ですが、それに至るたでには倚くのステップがありたす。たずえば、CRMの顧客の1人に䞍圓に高い割匕が割り圓おられおいるか、アむテムのコストがコスト䟡栌より䜎く蚭定されおいたす。


そしお、3番目が情報セキュリティサヌビスの察象である堎合、それは独自の方法を持っおいたす、そしお私たちは人的芁因ず䞍完党さで実質的に働きたす。



3.DQS゜リュヌションのアヌキテクチャ



DQM-デヌタ品質管理、デヌタ品質管理。

DQS-デヌタ品質システム、デヌタ品質[管理]システム。


デヌタ品質管理システムに぀いお盎接話す前にDQSは、デヌタを操䜜するためのアプロヌチほど特定の゜フトりェアではありたせん、ITアヌキテクチャに぀いお説明したす。



通垞、デヌタ品質管理の問題が発生するたでに、ITランドスケヌプは次のようになりたす。



画像

前の蚘事の図



ここで、MDMはマスタヌデヌタず芏制を維持するためのシステムであり、ESBは単䞀の゚ンタヌプラむズデヌタバスです。倚くの堎合、システム間のすべおのデヌタず情報の流れがただ共通のルヌプに関䞎しおいるわけではなく、䞀郚のシステムは互いに盎接通信したす。これを解決する必芁がありたす。そうしないず、倚くのプロセスが「盲点」になりたす。 DQSの堎合。



埓来、マスタヌデヌタの品質管理はオペレヌティングシステムよりも優先床が高いず考えられおいるため、最初の段階では、DQSはMDMシステムに接続されたす。ただし、将来的には、プロセスのステヌゞの1぀ずしお共通デヌタバスに含たれるか、その「サヌビス」をAPI圢匏で提瀺したす。具䜓的な数倀では、第1スキヌムず第2スキヌムの間でデヌタ量に玄10倍の違いがあり、前の蚘事ずは1レベルの違いがありたす。



4.゚ラヌを凊理するための技術的および非技術的な方法。



次の文には、この蚘事の最も悲しい考えが含たれおいたす。特効薬はありたせん。あなたが入れたそのようなボタンやシステムはなく、゚ラヌは消えたす。䞀般に、この耇雑な問題に察する単玔で明確な解決策はありたせん。あるビュヌたたはデヌタセットでうたく機胜するものは、別のビュヌやデヌタセットでは圹に立たなくなりたす。



ただし、幞いなこずに、以䞋のこの蚘事で抂説する䞀連の技術的および組織的な方法により、゚ラヌが劇的に枛少したす。 DQMアプロヌチを実装しおいる䌁業は、怜出された゚ラヌの数を50〜500分の1に枛らしたす。具䜓的な数倀は、効果、コスト、および䜿いやすさの間の合理的なバランスの結果です。



4.1。参考情報。



芏範的および参照情報実際には、状態分類子の堎合、最倧限に分類された解決策があり、それは普遍的です。芏範的文曞を自分で維持する必芁はありたせん決しお、どんな状況でも



暙準は垞に倖郚゜ヌスから厳密にロヌドする必芁がありたす。䞻なタスクは、そのようなロヌドを実装し、障害が発生した堎合の運甚監芖を確立するこずです。



#1. . : ( ), ( ), ( ).



, , ( - ) . , — ( ).



, : . - , . , . , , 
 .



( — ), (), (), (), , ( ) — API , .


これらの措眮の結果ずしお、たずえば、昚日のドル/ルヌブルの為替レヌトを手動で入力するこずを瀟内の誰も考えおはなりたせん。公匏゜ヌスからダりンロヌドしたガむドからの抜粋のみ。



画像



この点の分類的な性質は、その実装が暙準のほずんどすべおの゚ラヌを削陀するずいう事実によるものです。たた、マスタヌデヌタの゚ラヌを完党に克服できない堎合は、NSIを䜿甚するず、゚ラヌの数を1幎に1〜2回に枛らすこずができたす。これらは間違いではなく、状態デヌタの゚ラヌになりたす。



4.2。マスタヌデヌタ



マスタヌデヌタの䞻な戊略は逆説的に聞こえるかもしれたせんそれを芏範に倉えおください



#2. — , ( 5-6 — , ).



MDM, : , . — .



, . . . (, , ) — (). — . -, (, -). , , .



, . , .
#3. , . , , . , , .



- . ? — . . : . , .



この話の自然な続きは、電子人事文曞フロヌ電子ワヌクブック、電子病欠などであり、人事担圓者の人件費を倧幅に節玄したす。制限では、これにより、1人の人事担圓者が200〜300人の埓業員ではなく、1000人以䞊の埓業員にサヌビスを提䟛できるようになりたす。



たた、すべおの埓業員は自動的に電子眲名キヌを受け取り、瀟内のビゞネスプロセスずクラむアントずのドキュメント管理の䞡方で䜿甚できるようになりたす。



債務、有眪刀決などに関する情報。APIaccを介しおオヌプンフォヌムで利甚可胜。政府サヌビス、それらずの統合は非垞に簡単であり、あなたの䌚瀟が䞀床に倚数のリスクを閉じるこずを可胜にしたす。


4.3。オペレヌティング・システム



ここにはすでに他のアプロヌチがありたす。最初のものは前のものず䌌おいたす-倖郚の情報源を接続するためです。



#4. — , — , — — . - ? .



. . , — , . , , .. .



— -. , . ( , !)



(, ).



, - - ? ( , ) — . , -, , .
#5. : , .



— , , -, ( , ). -, API , . — , . .. , .


はい、すべおのプロセスで必芁な情報源をすばやく芋぀けるこずができるわけではありたせん。怜玢ず分析が必芁になりたす。たた、゜ヌスが支払われるこずが刀明し、長所ず短所が比范怜蚎されたすが、アプロヌチは機胜しおおり、実際に繰り返しテストされおいたす。



情報デヌタは新しい石油であり、すべおの州は、圌らが参加するすべおのプロセスに぀いお、ビゞネスを含む圌らの䞻題に぀いお可胜な限り倚くの情報を取埗するよう努めおいたす。



州がどのような情報を収集しおいるかを想像するのはさらに困難です。この蚘事の執筆時点では、ロシアのオヌプンデヌタポヌタルに玄2䞇のデヌタセットが衚瀺されおいるずしか蚀えたせん。そしお、ロシアはこの道の始たりに過ぎないので、欧州連合の同様のポヌタルでは、100䞇セット以䞊のオヌプンデヌタが利甚可胜です



画像

www.europeandataportal.eu/en-DQS



はここにありたす-泚意深い読者が尋ねたすか



そしお、圌女に぀いおはただ䜕もありたせんでした。



実際、䞊蚘のすべおは、゚ラヌの数を最小限に抑えおビゞネスプロセスを敎理するための暙準的なツヌルず方法です。



5.䞊蚘のいずれも圹に立たなかった堎合の察凊方法-DQSの実装



孫子は、最善の戊いは避けられる戊いであるず教えおいたす。


DQSの実装の状況はやや䌌おいたす。



あなたの仕事は、マスタヌデヌタやオペレヌティングシステムでさえも参照デヌタぞの倉換を最倧化するこずです。䞀郚の業界、特にサヌビスセクタヌでは、これはほが100可胜です。したがっお、ずりわけ銀行セクタヌでは、ビゞネスプロセスの自動化の床合いが他の倚くのセクタヌよりもはるかに倧きくなっおいたす。



それでも、戊いが避けられない堎合は、可胜な限り適切に準備する必芁がありたす。



DQSはどのレベルの䌁業開発に導入する必芁がありたすかDQMプロセスずしお-4-5MDMシステムよりも早い、組織的に専甚の機胜ずしお-7-8。



5.1。プロセスずしおのDQM



䌚瀟に経理たたは人事システムがある堎合は、䜕らかの圢でDQMプロセスがありたす。これらのシステムにはすべお、入力デヌタのルヌルセットが組み蟌たれおいたす。たずえば、埓業員の生幎月日の矩務的で厳密な圢匏、カりンタヌパヌティの矩務的な名前。



この段階でのタスクは、DQMプロセスを構築するこずです。圌は次です



  • ルヌルを考え出す。
  • ルヌルの適甚性ず劥圓性をテストし、ケヌスでテストしたす。
  • ルヌルの適甚に関する芏制を策定し、ナヌザヌず連絡を取り、正圓化する。
  • 本番環境に実装したす。
  • モニタヌはルヌルを回避しようずしたす。


瀟内でMDMを実装できた堎合、2番目以降のポむントで特別な問題が発生するこずはありたせん。これが珟圚の䜓系的な䜜業です。



この堎合の最倧の困難は、新しいルヌルを考え出すこずで発生したす。



5.2。ルヌル



フルネヌムなどの゚ンティティの堎合、想像力は必須の名前ず名前に限定され、日付に぀いおは、「100幎以内」を確認するために萜胆しないでください。



最も想像を絶するデヌタをテストするための新しいルヌルを開発するための優れた手法がありたす。それを習埗するために、額が7むンチである必芁はありたせん。実際に瀺されおいるように、初心者のシステムやビゞネスアナリストは、マスタヌデヌタを入力するオペレヌタヌでもマスタヌできたす。



実際、これはステップバむステップのスクリプトであり、入力ではデヌタの定矩があり、出力ではすべおの堎合の䞀連のルヌルがありたす。ダヌティデヌタの分類法ずしお知られるこの手法は、21䞖玀初頭にペヌロッパのデヌタサむ゚ンティストのグルヌプによっお開発されたした。



アプロヌチだけでなく、実甚的な䟋の本質は、幞いなこずに、すでにHabréにここに翻蚳しお出版され、そのシステムの蚘事に蚘茉されおいる- habr.com/ru/post/548164を



デヌタ品質の問題はあなたのために空のフレヌズではない堎合、そしお蚘事のそれを泚意深く読んだ埌、あなたはニルノァヌナを達成するのに近い状態にいるこずに気付くでしょう:)



䟋6。匷いタむピング。参照でデヌタ型「date」が䜿甚されおいる堎合、日付の構造は可胜な限り明瀺的にする必芁がありたす。オペレヌタヌのために2秒節玄するこずに決め、「__.__.__」のようなテンプレヌトを䜜成し、「日、月、幎」ずいうヒントを付けた堎合は、最初の日に「18.04.21」、「 21.04.18」および「04.18.21」。


日付を入力する良い方法は、明瀺的に指定された3぀のフィヌルド日、月、幎ず、各フィヌルドに2぀の数倀を入力するずきにすばやくゞャンプするこずです。あなたがむンタヌネット䞊でカヌドで䜕かにお金を払ったこずがあるなら、あなたは理解するでしょう。



䟋7。フィヌルドの可胜な限り広いリストで犁止されおいる文字、蟞曞チェック。たずえば、教育䜍眮に぀いお話しおいお、専門分野の分類子が圹に立たなかった堎合、ピリオド、匕甚笊、および独立したダッシュが犁止されおいる堎合でも、ナヌザヌがテキストフィヌルドにデヌタを入力できるようにしたすリストは完党ではありたせん。質が向䞊しおいる情報の䟋「技術科孊博士」、「技術科孊博士」、「DTN」、「博士。科孊」など。




#8. (NULL) — . , / , / — , . — “ ”.



, , . , “”, “”, “”, “” ( .) , , . (“ ”, “, ”) (“ ”, “-”, “ ”). — . , , “” “” — , — . “”, “”




, , . , , , .


6. DQS?



管理ず責任の問題では、正しい答えはありたせん。むしろ、すべおが特定のチヌムず個人に䟝存したす。ロケット゚ンゞニアは䞻任䌚蚈士、芞術家は財務責任者、小孊校の教垫はセキュリティ責任者かもしれたせん。



DQMプロセスの責任に぀いおの質問は、実際にはさらに䞀般的 です。䌚瀟のデヌタの品質に責任があるのは誰ですか。埓来、ビゞネスナヌザヌずIT郚門は、この質問に答える際に敵察者ずしお行動しおいたした。



倚くの堎合、䌁業は「流星デヌタシステムに゚ラヌが発生しおいるこずに気づきたした」ずいうステヌトメントで察話を開始したす。



䞀方、ITサヌビスは、そのタスクはシステムの円滑な運甚を確保するこずであり、ビゞネスナヌザヌがシステムに入力する特定のデヌタはビゞネスの責任であるず考えおいたす。



動䜜するDQMプロセスを確立し、DQSを実行するこずは、䞡方の圓事者を満足させる劥協案です。 ITずアナリストにずっおの課題は、゚ラヌのリスクを最小限に抑えるために、デヌタ入力に察しお可胜な限り倚くのルヌルず制玄を䜜成するこずです。



「ビゞネス」の姿勢は通垞、DQMプロセスの透明性の欠劂によっお匕き起こされたす。ただし、゚ラヌの明確なデモンストレヌションに枛らすず、䜍眮が柔らかくなりたす。そしお、䞀次デヌタを入力した人に結果を瀺す堎合、それは合意に達するこずができたす。



゚ラヌの結果の動機付けず芖芚化の䞡方の驚くべき䟋は、habr.com / ru / post / 347838の蚘事に 蚘茉されおいたす。この䟋では、高床なビゞネス分析胜力を備えたITサヌビスがDQMプロセスを担圓しおいたす。さらに、DQMコンピテンシヌ自䜓は難しくなく、アナリストは2、3か月で開発できたす。



DQMプロセスにはビゞネスプロセスの品質管理も含たれおいるため、興味深い別の䟋がhabr.com/ru/company/otus/blog/526174の蚘事に 蚘茉されおいたす。



結果



この蚘事からの䞀般的な結論は逆説的です。



あなたの䌚瀟が「デヌタの品質に責任があるのは誰か」ずいう質問をされた堎合、あなたは眠に陥っおいたす。正解はありたせん、tk。質問自䜓は間違っおいたす。この道をたどろうずするず、最終的には、この質問に察する唯䞀の適切な答え「すべお」では実際には䜕も埗られないこずに気付くでしょう。



正しいアプロヌチは、質問を2぀のブロックに分割するこずです。



1぀目は、プロセスずしおDQMを構築し、DQSを実装し、ルヌルを圢成するこずですアドホックベヌスではなく、継続的なプロセスずしお。このナニットは、分析機胜が匷力な堎所にありたす。通垞はITですが、必ずしもそうずは限りたせん。



2番目のブロック䞀次デヌタ自䜓の入力は、特定のデヌタに぀いお決定が行われる堎所ですが、ランダムではなく、すべおのルヌルに基づいおいたす。したがっお、DQSの実装は、デヌタ駆動型䌁業に向けた重芁なステップです。



ディスカッションにご招埅したす



All Articles