λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
BISTelligence Tech Story/Better Tech trend

Data Mesh : 데이터 쀑심 κΈ°μ—…ν˜μ‹ μ„ μœ„ν•œ νŒ¨λŸ¬λ‹€μž„ μ „ν™˜

2023. 8. 4.

🚩 데이터 μ€‘μ‹¬μ˜ κΈ°μ—…ν˜μ‹ μ„ μœ„ν•œ Data Mesh에 λŒ€ν•΄ μ†Œκ°œν•©λ‹ˆλ‹€.


#1. νŒ¨λŸ¬λ‹€μž„μ˜ μ‹œμž‘

미ꡭ의 μ €λͺ…ν•œ 뢄석 μ² ν•™μžμ΄μž λ¬Όλ¦¬ν•™μžμΈ ν† λ¨ΈμŠ€ μ‚¬λ¬΄μ—˜ μΏ€(Thomas Samuel Kuhn)은 1962λ…„ 그의 μ €μ„œ γ€Žκ³Όν•™ν˜λͺ…μ˜ ꡬ쑰 (The structure of scientific revolutions)γ€μ—μ„œ ‘νŒ¨λŸ¬λ‹€μž„’을 μ •μ˜ν•˜μ˜€μŠ΅λ‹ˆλ‹€.

νŒ¨λŸ¬λ‹€μž„ : ν•œ μ‹œλŒ€λ₯Ό μ§€λ°°ν•˜λŠ” μΈμ‹μ΄λ‚˜ 과학적 사고, 관념, κ°€μΉ˜κ΄€μ΄ κ²°ν•©ν•œ ν”„λ ˆμž„

κ³Όν•™μžλ“€μ€ 이 νŒ¨λŸ¬λ‹€μž„ μ•ˆμ—μ„œ 연ꡬλ₯Ό μ§„ν–‰ν•˜λŠ”λ°, νŒ¨λŸ¬λ‹€μž„μ— μ•ˆμ£Όν•˜μ§€ μ•Šκ³  점차 ν•œκ³„λ₯Ό 깨뜨릴 λ•Œ 진보λ₯Ό 달성할 수 있게 λ©λ‹ˆλ‹€. μš°λ¦¬κ°€ 짧은 μ„ΈκΈ° λ™μ•ˆ μ½”νŽ˜λ₯΄λ‹ˆμΏ μŠ€ 혁λͺ…, μ‚°μ—…ν˜λͺ…, 정보 혁λͺ…κ³Ό 같은 μ—„μ²­λ‚œ μ‹œλŒ€μ  혁λͺ…을 이룬 것은 기쑴의 νŒ¨λŸ¬λ‹€μž„μ„ μ΄ˆμ›”ν•˜λ©΄μ„œ μƒˆλ‘œμš΄ 것을 λ§Œλ“€μ–΄ λƒˆκΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. ν† λ¨ΈμŠ€ μ‚¬λ¬΄μ—˜ 쿀은 μ΄λŸ¬ν•œ μ‹œλŒ€μ  μ „ν™˜κ³Ό 혁λͺ…은 κΈ°μ‘΄ νŒ¨λŸ¬λ‹€μž„μ— 문제점이 λ§Žμ„ μ‹œ, λ‚˜νƒ€λ‚˜λ©° νŒ¨λŸ¬λ‹€μž„μ˜ μ „ν™˜μ΄ 일어날 λ•Œ μœ„κΈ°μ™€ ν•¨κ»˜ λ¨Όμ € μƒˆλ‘œμš΄ νŒ¨λŸ¬λ‹€μž„μ΄ μΆœν˜„ν•œ λ’€ κ·Έ 체계가 μ •κ΅ν™”λœλ‹€κ³  μ–ΈκΈ‰ν–ˆμŠ΅λ‹ˆλ‹€.

 

1-1. κΈ°μ—…μ˜ 데이터 ν˜μ‹ κ³Ό 데이터 κ΄€λ¦¬μ˜ 어렀움

데이터 λ ˆμ΄ν¬μ™€ 데이터 μ›¨μ–΄ν•˜μš°μŠ€

λ§Žμ€ 기업듀이 데이터λ₯Ό 톡해 λΉ„μ¦ˆλ‹ˆμŠ€ 톡찰λ ₯을 μ–»κ³ , ꢁ극적으둜 μžλ™ν™”λœ 지λŠ₯ν˜• μ˜μ‚¬κ²°μ •κ³Ό 규λͺ¨μ— λ§žλŠ” 데이터 λ―Όμ£Όν™”μ˜ 희망을 ν’ˆκ³  μ°¨μ„ΈλŒ€ 데이터 ν”Œλž«νΌμ— νˆ¬μžν•©λ‹ˆλ‹€. ν•˜μ§€λ§Œ 전톡적인 쀑앙 집쀑식 데이터 μ•„ν‚€ν…μ²˜ ‘데이터 레이크’, ‘데이터 μ›¨μ–΄ν•˜μš°μŠ€’의 경우 λ°μ΄ν„°μ˜ λ³΅μž‘μ„±κ³Ό 규λͺ¨ 증가에 λŒ€μ‘ν•˜κΈ° μ–΄λ €μ›Œ 병λͺ© ν˜„μƒ, λΉ„νš¨μœ¨μ„± 및 데이터 격리 λ¬Έμ œκ°€ λ°œμƒν•˜κ²Œ λ©λ‹ˆλ‹€.

데이터 λ ˆμ΄ν¬μ™€ 데이터 웨어 ν•˜μš°μŠ€λ₯Ό λ„μž…ν•΄ 빅데이터λ₯Ό ν†΅ν•œ 톡찰λ ₯을 μ–»κ³ μž ν–ˆλ˜ 기업듀은 μ—¬λŸ¬ μ°¨λ‘€ μ‹€νŒ¨λ₯Ό κ²½ν—˜ν•˜λ©°, 데이터 μžμ‚°μ„ 효과적으둜 κ΄€λ¦¬ν•˜κ³  ν™œμš©ν•˜λŠ”λ° 어렀움을 κ²ͺκ³  μžˆμŠ΅λ‹ˆλ‹€.

 

1-2. Data Mesh : μƒˆλ‘œμš΄ νŒ¨λŸ¬λ‹€μž„μ˜ ν•„μš”

ν˜„μž¬μ˜ β€»μ •μƒκ³Όν•™μœΌλ‘œ μΌμ»«λŠ”, μ •μƒλΆ„ν¬μ˜ 쀑간값에 ν•΄λ‹Ήν•˜λŠ” 것, 즉 μ‹œκ°„μƒ κ°€μž₯ λ§Žμ€ μ‹œκ°„μ΄ νˆ¬μ—¬λœ 방식인 μ€‘μ•™μ§‘μ€‘ν™”λœ 데이터λ₯Ό μ½˜μ›¨μ΄μ˜ 법칙(Conway’s law)을 톡해 μ½”λ”©μœΌλ‘œ μ΄μ–΄μ§ˆ κ²ƒμ΄λΌλŠ” 관념은 μ—¬μ „νžˆ μ‘΄μž¬ν•©λ‹ˆλ‹€.

※정상과학 : 과거의 과학적 성취에 ν™•κ³ νžˆ κΈ°λ°˜μ„ λ‘” 연ꡬ ν™œλ™

ν•˜μ§€λ§Œ 빅데이터λ₯Ό κΈ°κ³„ν•™μŠ΅(ML)ν•œ 데이터 기반 λ˜λŠ” AI μœ ν˜•μ˜ μ„œλΉ„μŠ€λ₯Ό μ œκ³΅ν•˜λŠ” νšŒμ‚¬μ—μ„œλŠ” ν˜„ νŒ¨λŸ¬λ‹€μž„μ—μ„œ μ œμ‹œν•˜λŠ” ν•΄κ²°μ±…μœΌλ‘œλŠ” 닡을 찾을 수 μ—†λŠ” μœ„κΈ°μ— 이λ₯΄λ €μŠ΅λ‹ˆλ‹€. 같은 κΈ°μ—… λ‚΄μ—μ„œ, 빅데이터λ₯Ό λ‹€λ£¨λŠ” 수백 개의 μ‹œμŠ€ν…œμ— 걸쳐 λ˜λŠ” μ™ΈλΆ€μ—μ„œ μ‚¬μš©ν•  수 μžˆλŠ” μœ λΉ„μΏΌν„°μŠ€ λ°μ΄ν„°μ˜ μ†ŒλΉ„κ°€ λͺ¨λ‘μ—κ²Œ μœ μ˜λ―Έν•˜κ²Œ 좩쑱되렀면, 데이터λ₯Ό κ΄€λ¦¬ν•˜λŠ” 방법에 λŒ€ν•œ 근본적인 ꡬ성과 κ°œλ…μ  μΈ‘λ©΄μ—μ„œ νŒ¨λŸ¬λ‹€μž„μ˜ μ „ν™˜μ΄ ν•„μš”ν–ˆκ³ , 근본적으둜 데이터 ν”Œλž«νΌ μ•„ν‚€ν…μ²˜λ₯Ό λ’·λ°›μΉ¨ν•˜λŠ” κΈ°μ‘΄ μ›μΉ™κ³Όμ˜ λŒ€μ‘°λ₯Ό 이루며 λΆ€μƒν•˜λŠ” κ΄€λ…μ˜ 혁λͺ…μ΄μž νŒ¨λŸ¬λ‹€μž„μ˜ μ „ν™˜ ‘Data Mesh’κ°€ λ“±μž₯ν•˜κ²Œ λ©λ‹ˆλ‹€.

#2. Data Meshλž€?

The four principles of data mesh. ;Source: Data Mesh by Zhamak Dehghani, O'Reilly Media,Inc

2-1. Data Mesh의 원칙

1.1 데이터 μ†Œμœ κΆŒκ³Ό κ±°λ²„λ„ŒμŠ€μ˜ λ―Όμ£Όν™”
데이터 λ©”μ‹œλŠ” 데이터 μ†Œμœ κΆŒκ³Ό κ±°λ²„λ„ŒμŠ€μ˜ νŒ¨λŸ¬λ‹€μž„ μ „ν™˜μ„ λ§ν•©λ‹ˆλ‹€. 쀑앙집쀑식 ITνŒ€μ— μ˜μ‘΄ν•˜λŠ” 것이 μ•„λ‹Œ 도메인 μ€‘μ‹¬μ˜ νŒ€μ—κ²Œ 데이터 μ†Œμœ κΆŒμ„ λΆ€μ—¬ν•˜κ²Œ λ©λ‹ˆλ‹€. μ΄λŸ¬ν•œ λΆ„μ‚° μ ‘κ·Ό 방식은 데이터λ₯Ό κ°€μž₯ 잘 μ΄ν•΄ν•˜κ³  κ°€μž₯ κ°€κΉŒμš΄ νŒ€μ΄ 의미 μžˆλŠ” 톡찰λ ₯을 μ–»κΈ° μœ„ν•΄ ν•„μš”ν•œ λ§₯락을 κ°€μ Έκ°ˆ 수 μžˆλ„λ‘ 보μž₯ν•˜λ©°, μ΄λŸ¬ν•œ λ°©μ‹μœΌλ‘œ 각 도메인은 μžμœ¨μ„±μ„ κ°€μ§€λŠ” λ™μ‹œμ— 쑰직 및 κ·œμΉ™μ„ μ€€μˆ˜ν•˜λ©° λΉ λ₯΄κ²Œ ν˜μ‹ μ΄ κ°€λŠ₯ν•©λ‹ˆλ‹€.

1.2 λ°μ΄ν„°μ˜ μ œν’ˆ
데이터 λ©”μ‹œλŠ” 데이터λ₯Ό μ œν’ˆμœΌλ‘œ μ·¨κΈ‰ν•˜κ³ , λͺ…ν™•ν•œ API, λ¬Έμ„œν™” 및 ν‘œμ€€ν™”λœ 데이터 ν’ˆμ§ˆ 츑정을 κ°–μΆ₯λ‹ˆλ‹€. 이λ₯Ό 톡해 데이터 λ©”μ‹œλŠ” λ‹€μ–‘ν•œ 도메인 간에 데이터 검색, μ•‘μ„ΈμŠ€ 및 ν™œμš©μ„ μ›ν™œν•˜κ²Œ μ§€μ›ν•˜μ—¬ ν˜‘μ—…κ³Ό ν˜μ‹ μ„ μ΄‰μ§„ν•©λ‹ˆλ‹€.

1.3 μ…€ν”„ μ„œλΉ„μŠ€ 데이터 인프라
데이터 λ©”μ‹œλŠ” μ…€ν”„μ„œλΉ„μŠ€ 데이터 ν”Œλž«νΌ ꡬ좕을 κ°•μ‘°ν•˜λ©°, 도메인 νŒ€μ΄ 데이터 μ„œλΉ„μŠ€λ₯Ό λ…λ¦½μ μœΌλ‘œ ꡬ좕, 배포 및 μš΄μ˜ν•  수 μžˆλ„λ‘ μ§€μ›ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 도메인 νŒ€μ€ μ‹ μ†ν•œ 반볡과 μ‹€ν—˜μ„ 톡해 더 λΉ λ₯΄κ²Œ 톡찰λ ₯이 전달할 수 있으며, 쀑앙 집쀑식 IT νŒ€μ— λŒ€ν•œ μ˜μ‘΄λ„λ₯Ό 쀄이고 ν˜μ‹ μ„ 도λͺ¨ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

 

2-2. Data Meshκ°€ 데이터 인프라에 λ―ΈμΉ˜λŠ” 영ν–₯

2.1 데이터 격리 문제 ν•΄κ²°
데이터 λ©”μ‹œλŠ” 데이터 μ†Œμœ κΆŒκ³Ό κ±°λ²„λ„ŒμŠ€λ₯Ό 도메인 μ€‘μ‹¬μ˜ νŒ€μ— λΆ„μ‚°ν•˜μ—¬ 데이터 격리 문제λ₯Ό ν•΄κ²°ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 데이터가 ν•„μš”ν•œ μ ‘κ·Ό κΆŒν•œμ΄ μžˆλŠ” λˆ„κ΅¬λ“ μ§€ 데이터 μžμ‚°μ— μ›ν™œν•˜κ²Œ μ ‘κ·Όν•  수 있으며, νŒ€ κ°„μ˜ ν˜‘μ—…κ³Ό 지식 κ³΅μœ κ°€ κ°€λŠ₯ν•΄μ§‘λ‹ˆλ‹€. 데이터 격리 문제λ₯Ό ν•΄κ²°ν•¨μœΌλ‘œμ¨ 쑰직의 집단 지성을 ν™œμš©ν•˜κ³  쒅합적인 톡찰λ ₯을 얻을 수 μžˆμŠ΅λ‹ˆλ‹€.

2.2 ν–₯μƒλœ 데이터 ν’ˆμ§ˆκ³Ό 일관성
데이터 λ©”μ‹œμ—μ„œλŠ” 도메인 νŒ€μ΄ 데이터 ν’ˆμ§ˆμ„ μ±…μž„μ§€λ©°, λ°μ΄ν„°μ˜ μ •ν™•μ„±, μ‹ λ’°μ„± 및 μ΅œμ‹ μ„±μ„ 보μž₯ν•©λ‹ˆλ‹€. ν‘œμ€€ν™”λœ 데이터 ν’ˆμ§ˆ μΈ‘μ •κ³Ό λ¬Έμ„œν™”λ₯Ό 톡해 μ‹ λ’°ν•  수 μžˆλŠ” 데이터λ₯Ό ν™œμš©ν•˜μ—¬ 확신을 두고 μ˜μ‚¬ 결정을 내릴 수 있게 λ„μ™€μ€λ‹ˆλ‹€.

2.3 민첩성과 ν™•μž₯μ„±
데이터 λ©”μ‹œλŠ” 도메인 νŒ€μ΄ λ…λ¦½μ μœΌλ‘œ 데이터 μ„œλΉ„μŠ€λ₯Ό κ΅¬μΆ•ν•˜κ³  λ°œμ „μ‹œν‚¬ 수 μžˆλ„λ‘ ν•¨μœΌλ‘œμ¨ 민첩성과 ν™•μž₯성을 μ œκ³΅ν•©λ‹ˆλ‹€. μ…€ν”„ μ„œλΉ„μŠ€ κΈ°λŠ₯을 κ°–μΆ˜ 데이터 λ©”μ‹œλ₯Ό 톡해, 각각의 도메인 νŒ€μ€ λΉ„μ¦ˆλ‹ˆμŠ€μ˜ 변화에 λΉ λ₯΄κ²Œ λŒ€μ‘ν•˜κ³  μƒˆλ‘œμš΄ 데이터 μ›μ²œμ„ ν†΅ν•©ν•˜λ©°, μ‹œμž₯ 동ν–₯에 μ‹ μ†ν•˜κ²Œ λŒ€μ‘ν•΄ ν˜μ‹ κ³Ό μ„±μž₯을 이끌 수 μžˆμŠ΅λ‹ˆλ‹€.

data mesh topology

DataMesh Topology Source:https://towardsdatascience.com/data-mesh-topologies-85f4cad14bf2

 

#3.Data Mesh둜 λΉ„μ¦ˆλ‹ˆμŠ€ ν˜μ‹ ν•˜κΈ°

κ·Έλ ‡λ‹€λ©΄ μ™œ? 데이터 λ©”μ‹œλ₯Ό μ‚¬μš©ν•΄μ•Ό ν•˜λ©°, 이λ₯Ό μ‚¬μš©ν•¨μœΌλ‘œμ¨ μš°λ¦¬μ—κ²Œ 이점은 λ¬΄μ—‡μΌκΉŒμš”?

3.1 데이터 기반 μ˜μ‚¬ κ²°μ • 가속화
데이터 λ©”μ‹œλ₯Ό μ±„νƒν•¨μœΌλ‘œμ¨ 쑰직은 데이터 기반 μ˜μ‚¬ κ²°μ •μ˜ λ¬Έν™”λ₯Ό μ •μ°©μ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€. 도메인 νŒ€μ—κ²Œ 데이터 μ•‘μ„ΈμŠ€, 뢄석 및 해석 λŠ₯λ ₯을 λΆ€μ—¬ν•¨μœΌλ‘œμ¨ 더 λΉ λ₯Έ 톡찰λ ₯κ³Ό 기반 지식에 κΈ°λ°˜ν•œ μ˜μ‚¬ 결정을 내릴 수 있으며, 경쟁 μš°μœ„λ₯Ό 확보할 수 μžˆμŠ΅λ‹ˆλ‹€.

3.2 ν˜μ‹ κ³Ό ν˜‘μ—… μž₯λ €
데이터 λ©”μ‹œλŠ” λ‹€ λΆ€μ„œ κ°„μ˜ ν˜‘μ—…κ³Ό 지식 곡유λ₯Ό μ΄‰μ§„ν•©λ‹ˆλ‹€. λΆ„μ‚°λœ 데이터 μ†Œμœ κΆŒμ„ 톡해 νŒ€μ€ λ‹€λ₯Έ λ„λ©”μΈμ˜ 데이터λ₯Ό κ²°ν•©ν•˜μ—¬ μƒˆλ‘œμš΄ 톡찰λ ₯을 λ°œκ²¬ν•˜κ³  ν˜μ‹ μ μΈ 데이터 기반 μ†”λ£¨μ…˜μ„ μ°½μΆœν•  수 μžˆμŠ΅λ‹ˆλ‹€.

3.3 λ―Έλž˜μ§€ν–₯적 데이터 인프라 ꡬ좕
데이터 λ©”μ‹œλŠ” 적응 κ°€λŠ₯ν•˜κ³  λ―Έλž˜μ§€ν–₯적인 μ•„ν‚€ν…μ²˜λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€. 쑰직이 μ„±μž₯ν•˜κ³  데이터 λžœλ“œ μŠ€μΌ€μ΄ν”„ 변화에 따라 데이터 λ©”μ‹œλŠ” μƒˆλ‘œμš΄ 데이터 μ›μ²œ, 기술 및 λΉ„μ¦ˆλ‹ˆμŠ€ μš”κ΅¬ 사항을 μ‰½κ²Œ μˆ˜μš©ν•  수 μžˆλŠ” ν™•μž₯ κ°€λŠ₯ν•˜κ³  μœ μ—°ν•œ μ•„ν‚€ν…μ²˜λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

 

#4. 마치며

데이터 λ©”μ‹œλŠ” 데이터 μ€‘μ‹¬μ˜ κΈ°μ—…ν˜μ‹ μ„ μœ„ν•΄ 쀑앙 집쀑식 데이터 μ•„ν‚€ν…μ²˜μ˜ μ œμ•½μ—μ„œ λ²—μ–΄λ‚˜κΈ° μœ„ν•œ 데이터 μΈν”„λΌμ˜ νŒ¨λŸ¬λ‹€μž„ μ „ν™˜μ„ μ˜λ―Έν•©λ‹ˆλ‹€. λΆ„μ‚° μ ‘κ·Ό 방식, 데이터λ₯Ό μ œν’ˆμœΌλ‘œ μ·¨κΈ‰ν•˜κ³ , 도메인 νŒ€μ— κΆŒν•œμ„ λΆ€μ—¬ν•˜λŠ” 데이터 λ©”μ‹œλ₯Ό μ±„νƒν•¨μœΌλ‘œμ¨ λ°μ΄ν„°μ˜ μ§„μ •ν•œ 잠재λ ₯을 발휘 ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 데이터 λ©”μ‹œλ₯Ό κ΅¬ν˜„ν•˜μ—¬ 데이터 격리 문제λ₯Ό ν•΄κ²°ν•˜κ³ , 데이터 ν’ˆμ§ˆμ„ ν–₯μƒμ‹œν‚€λ©°, 데이터 기반 ν˜μ‹  λ¬Έν™”λ₯Ό μ‘°μ„±ν•˜μ—¬ 쑰직과 기업을 데이터 주도적 μ„±κ³΅μœΌλ‘œ 이끌 수 μžˆμŠ΅λ‹ˆλ‹€.

β€» μ°Έκ³ λ¬Έν—Œ
1) Kuhn TS., “The Structure of Scientific Revolutions.”, 1970, Chicago: U of Chicago P.
2) Zhamak D, H., Luo, J., Hu, Y., Zhu, S., Dong, X., & Ruan, L., “Data Mesh: A Paradigm Shift in Data Platform Architecture.”, 2021, arXiv:2103.06354.


Written by Stella| Business Unit Principal Consultant πŸ˜€
기술의 ν˜μ‹ κ³Ό ν˜„μ‹€μ μΈ 문제 해결에 κΈ°μ—¬ν•˜λ©°, μ‚¬νšŒμ™€ κΈ°μ—…μ˜ 지속가λŠ₯ν•œ μ„±μž₯을 μœ„ν•΄ μ΅œμ„ μ„ λ‹€ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. ν•¨κ»˜ λ‚˜λˆ”κ³Ό μƒμƒμ˜ κ°€μΉ˜λ₯Ό μ‹€μ²œν•˜λ©°, AI와 디지털 μ „ν™˜μ„ 톡해 μ‚¬νšŒμ— 긍정적인 영ν–₯을 λ―ΈμΉ˜λŠ”λ° μ•žμž₯μ„œκ² μŠ΅λ‹ˆλ‹€. κ°μ‚¬ν•©λ‹ˆλ‹€.