Db2 서로 다른 값 비교 방법

이 문서에서는 Tableau를 IBM DB2 데이터베이스에 연결하고 데이터 원본을 설정하는 방법에 대해 설명합니다. 이 커넥터를 사용하여 z/OS 데이터베이스의 IBM DB2에도 연결할 수 있습니다. 지원되는 DB2 데이터베이스를 확인하려면 Technical Specifications(기술 사양) 페이지를 참조하십시오.

시작하기 전에

시작하기 전에 다음과 같은 연결 정보를 수집하십시오.

  • 연결하려는 데이터베이스를 호스팅하는 서버의 호스트 이름과 포트 번호

  • 데이터베이스 이름

  • 사용자 이름(사용자 ID) 및 비밀번호

  • SSL 서버에 연결하는지 여부

  • (선택 사항) Tableau가 연결할 때마다 실행할 초기 SQL 문

Windows 컴퓨터에 설치된 Tableau Desktop에서 이 커넥터를 사용하십시오.

포트 설정

포트 번호는 연결하는 서버 유형 및 암호화된 포트에 연결하는지 여부에 따라 달라집니다. 일반적으로 암호화되지 않은 포트에는 50000을 사용하고 암호화된 포트에는 60000을 사용합니다. 서버가 비표준 포트를 사용하도록 구성되어 있을 수 있습니다. 연결할 포트를 모르는 경우 관리자에게 문의하십시오.

SSL 요구 사항

이 커넥터를 사용하면 SSL 인증을 사용하여 서버에 연결할 수 있습니다. SSL 환경에서 작업하는 경우 컴퓨터는 이미 SSL을 지원하도록 구성되어 있을 것입니다. Tableau와의 SSL 연결에 문제가 있는 경우 컴퓨터에 다음 IBM 소프트웨어가 설치되어 있는지 확인하십시오.

  • IBM Data Server Runtime Client v10.5fp3 이상

  • GSK8 SSL 라이브러리

IBM Data Server Runtime Client 및 GSK8 라이브러리는 비트 수가 같아야 합니다. 예를 들어 둘 모두 32비트이거나 64비트여야 합니다. 자세한 내용은 IBM 웹 사이트에서 GSK8 SSL 라이브러리 설치(영문)(링크가 새 창에서 열림)을 참조하십시오.

필요한 드라이버

이 커넥터가 데이터베이스와 통신하려면 드라이버가 필요합니다. 필요한 드라이버가 이미 컴퓨터에 설치되어 있을 수 있습니다. 컴퓨터에 드라이버가 설치되어 있지 않으면 연결 대화 상자에 드라이버 링크 및 설치 지침을 찾을 수 있는 드라이버 다운로드(링크가 새 창에서 열림) 페이지에 대한 링크와 함께 메시지가 표시됩니다.

연결한 후 데이터 원본 설정

  1. Tableau를 시작하고 연결에서 IBM DB2를 선택합니다. 데이터 연결의 전체 목록을 보려면 서버로 아래에서 자세히를 선택합니다. 그런 후 다음을 수행합니다.

    1. 데이터베이스를 호스팅하는 서버의 이름(호스트 이름), 포트 번호 및 연결하려는 데이터베이스의 이름을 입력합니다.

    2. 사용자 이름(사용자 ID) 및 비밀번호를 입력합니다.

      연결할 수 없는 경우 자격 증명이 올바른지 확인합니다. 계속 연결할 수 없으면 컴퓨터에서 서버를 찾는 데 문제가 있는 것입니다. 네트워크 관리자나 데이터베이스 관리자에게 문의하십시오.

    3. (선택 사항) 초기 SQL을 선택하여 통합 문서를 열거나, 추출을 새로 고치거나, Tableau Server에 로그인하거나, Tableau Server에 게시할 때와 같이 모든 연결을 시작할 때 실행할 SQL 명령을 지정합니다. 자세한 내용은 초기 SQL 실행을 참조하십시오.

    4. 로그인을 선택합니다.

  2. 데이터 원본 페이지에서 다음을 수행합니다.

    1. (선택 사항) 페이지 상단에서 기본 데이터 원본 이름을 선택한 다음 Tableau에서 사용할 고유한 데이터 원본 이름을 입력합니다. 예를 들어 데이터 원본을 사용하는 다른 사용자가 어떤 데이터 원본에 연결해야 하는지를 쉽게 알 수 있는 데이터 원본 명명 규칙을 사용하십시오.

    2. 스키마 드롭다운 목록에서 원하는 스키마를 선택하거나 텍스트 상자를 사용하여 스키마 이름을 검색합니다.

    3. 테이블 아래에서 원하는 테이블을 선택하거나 텍스트 상자를 사용하여 테이블 이름을 검색합니다.

    4. 테이블을 캔버스로 끌어온 다음 시트 탭을 선택하여 분석을 시작합니다.

      사용자 지정 SQL을 사용하여 전체 데이터 원본이 아니라 특정 쿼리에 연결할 수 있습니다. 자세한 내용은 사용자 지정 SQL 쿼리에 연결을 참조하십시오.

참고: Tableau는 DECFLOAT 데이터 유형을 지원하지 않습니다.

참고 항목

  • 데이터 원본 설정 – 이 데이터 원본에 더 많은 데이터를 추가하거나 데이터를 분석할 수 있도록 준비합니다.
  • 차트 작성 및 데이터 분석 – 데이터 분석을 시작합니다.

Connecting Tableau to a Db2 database(Db2 데이터베이스에 Tableau 연결)(링크가 새 창에서 열림) - IBM 웹 사이트에서 연결 지침을 검토하십시오.

규모와 업종을 불문하고 모든 비즈니스에 있어서 빅 데이터의 세계가 점차 확장되고 있습니다. IDG에서 2016년에 진행한 설문조사에 따르면, 일반 기업에서 관리하고 있는 정보량이 무려 163테라바이트(163,000기가바이트)에 달합니다.

이러한 원시 데이터를 최첨단 인사이트로 전환하기란 쉽지 않습니다. 비즈니스가 기업 데이터 관리 실무를 숙달해야 직원이 뛰어난 업무 실적을 올리는 데 필요한 정보를 쉽게 생성, 저장, 이용, 관리, 분석할 수 있습니다.

엔터프라이즈 데이터를 관리하는 데 가장 일반적인 두 가지 형태의 데이터 스토리지는 데이터 웨어하우스와 데이터베이스일 것입니다. 그렇다면 데이터베이스와 데이터 웨어하우스의 차이점은 무엇이며, 어느 것이 각 기업의 상황에 가장 적합할까요?

이 게시글에서는 각 기업의 데이터 구조 상황에 가장 적합한 데이터 저장소를 파악할 수 있도록 데이터베이스와 데이터 웨어하우징의 차이점을 분석해 보겠습니다.

목차

  1. 데이터베이스란?
  2. 데이터 웨어하우스란?
  3. 데이터베이스와 데이터 웨어하우스의 주요 차이점
  4. 주요 차이점 설명
  5. 비교 차트
  6. 데이터 웨어하우스 및 데이터베이스와 데이터 마트 및 데이터 레이크 비교
  7. 데이터베이스와 데이터 웨어하우스 통합

데이터베이스란?

데이터베이스란 논리적으로 타당할 뿐만 아니라 데이터의 검색, 조작, 분석이 용이한 방식으로 저장된 정보의 조직화된 모음입니다.

데이터베이스 사용 방법

데이터베이스를 분류하는 가장 일반적인 방법은 SQL과 NoSQL의 비교(관계형과 비관계형의 비교라고도 함)일 것입니다.

SQL 또는 관계형 데이터베이스는 서로 다른 데이터 사이의 관계를 코드화하는 형식적 테이블 내에 정보를 구성합니다. 각 테이블은 Microsoft Excel의 스프레드시트 구조와 마찬가지로 행과 열로 구성됩니다. 사용자는 관계형 데이터베이스를 통해 검색하기 위해 데이터베이스와의 통신을 위한 도메인별 언어인 구조화된 쿼리 언어(SQL)로 쿼리를 작성합니다. 가장 널리 사용되는 4가지 SQL 데이터베이스 제품은 Oracle, Microsoft SQL Server, IBM Db2, MySQL입니다(순서에 상관없음).

반면, NoSQL 또는 비관계형 데이터베이스는 관계형 테이블 기반 데이터 모델의 범주에서 벗어나는 데이터를 저장하기 위한 모든 패러다임을 사용합니다. NoSQL 데이터베이스의 가장 일반적인 유형에는 키-값 저장소, 문서 기반 저장소, 열 기반 저장소, 그래프 기반 저장소가 있습니다. 가장 많이 사용되는 NoSQL 제품은 MongoDB, Cassandra, Redis입니다.

SQL과 NoSQL을 비교하자면, 두 가지 방식 모두 장단점이 있습니다. SQL 데이터베이스는 리소스 추가를 통해 수직적으로 확장이 용이한 반면, NoSQL 데이터베이스는 더 많은 머신을 추가하여 수평적으로 확장하기가 쉽습니다. 쿼리 작성 시 SQL을 사용하면 성능과 사용 용이성과 관련하여 큰 장점으로 작용할 수 있지만, 관계형 데이터베이스는 데이터 계층 면에서 유연성이 낮고 다소 경직적입니다.

관련 게시물: 최신 데이터베이스 시스템에 관한 개요

데이터 웨어하우스란?

데이터 웨어하우스란 조직 내 서로 다른 다양한 소스들의 정보를 집계하고 저장하는 시스템입니다.

데이터 웨어하우스 사용 방법

데이터 웨어하우스의 목표는 명백히 비즈니스 지향적입니다. 데이터 웨어하우스는 최종 사용자가 서로 다른 소스의 정보를 통합 및 분석할 수 있게 함으로써 의사 결정을 도모할 수 있도록 설계되었습니다. 

데이터베이스와 데이터 웨어하우스의 주요 차이점 설명

주된 차이점은 데이터베이스는 저장된 데이터의 조직화된 모음이며, 데이터 웨어하우스는 다양한 데이터 소스에서 빌드된 정보 시스템으로서 데이터 분석에 사용됩니다. 

다음은 상위 수준에서 데이터베이스와 데이터 시스템을 추가적으로 구별하는 차이점들입니다.

  1. OLTP 솔루션은 데이터베이스와 함께 사용될 때 가장 적합한 반면, 데이터 웨어하우스는 OLAP 솔루션에 가장 적합합니다.
  2. 데이터베이스는 한 번에 수천 명의 사용자를 처리할 수 있고, 데이터 웨어하우스는 상대적으로 작은 규모의 사용자만 처리합니다.
  3. 데이터베이스는 소규모의 원자성 트랜잭션에 가장 유용하며, 데이터 웨어하우스는 보다 높은 수준의 분석이 필요한 대규모 질문에 가장 적합합니다.
  4. 데이터베이스는 24시간 연중무휴로 사용 가능해야 하므로 다운타임 발생 시 큰 비용이 발생할 수 있으나, 데이터 웨어하우스는 다운타임의 영향을 크게 받지 않습니다.
  5. 데이터베이스는 신속한 CRUD 작업(생성, 읽기, 업데이트, 삭제)에 최적화되어 있습니다. 반면, 데이터 웨어하우스는 여러 개의 대규모 데이터 저장소에 걸쳐 발생하는 소규모의 복잡한 쿼리에 최적화되어 있습니다.
  6. 데이터베이스는 여러 테이블에서 정보가 중복되지 않고 최대한 효율적으로 구조화됩니다. 일반적으로 데이터 웨어하우스는 데이터를 비정규화하여 쓰기 작업보다 읽기 작업에 높은 우선 순위를 둡니다.
  7. 데이터베이스에는 주로 최신 정보만 포함되기 때문에 기록 쿼리가 불가능합니다. 데이터 웨어하우스는 처음부터 보고 및 분석 목적으로 설계되었습니다.

데이터 웨어하우스와 데이터베이스 비교 차트

매개 변수

데이터베이스

데이터 웨어하우스

용처

데이터 기록

데이터 분석

처리 방법

OLTP

OLAP

동시 사용자 수

수천 명 

제한적

사용 사례

소규모 트랜잭션

복잡한 분석

다운타임

항시 사용 가능 

일부 예정된 다운타임

최적화

CRUD 작업 기준

복잡한 분석 기준

데이터 유형

실시간 상세 데이터

요약형 기록 데이터

주요 차이점 설명

지금까지 데이터베이스와 데이터 웨어하우스의 개요를 알아봤는데 구체적 상황에서 이 두 가지를 어떻게 정확히 구분할 수 있을까요? 아래에서 데이터 웨어하우스와 데이터베이스의 가장 큰 차이점 7가지를 설명해 드리겠습니다.

1. OLTP와 OLAP 비교

온라인 트랜잭션 처리(OLTP)는 트랜잭션 중심의 데이터 처리 시스템을 일컫는 용어입니다. 일반적으로 OLTP는 비즈니스에서 매일 사용하는 정보를 포함하는 데이터베이스의 주요 패러다임으로, 빠르고 효율적인 쿼리와 정확한 최신 정보를 필요로 하는 직원들을 지원하기 위해 설계되었습니다.

반면, 온라인 분석 처리(OLAP)는 성능 및 일상적인 사용보다는 데이터 분석 및 의사 결정에 초점을 맞춘 데이터 처리 시스템을 일컫는 용어입니다. 많은 OLAP 시스템은 비즈니스 인텔리전스(BI) 솔루션과 연동되기 때문에 비기술직 관리자와 임원이 질문에 대한 답변을 쉽게 얻을 수 있습니다.

신속한 데이터 이용을 위해 OLTP 솔루션이 필요한 기업의 경우 주로 데이터베이스를 사용합니다. 한편 데이터 웨어하우스 시스템은 현재 데이터뿐만 아니라 과거 정보도 집계할 수 있는 OLAP 솔루션에 보다 적합합니다.

2. 동시 사용자 수

데이터베이스는 OLTP 시스템이기 때문에 성능 저하를 일으키지 않고 수천 명의 사용자를 동시에 지원할 수 있도록 설계되었습니다.

반면, OLAP 데이터 웨어하우스의 경우 지원할 수 있는 동시 사용자 수는 상대적으로 제한적입니다. 데이터 웨어하우스 솔루션은 여러 다양한 데이터 저장소를 순환하는 더욱 복잡한 쿼리를 사용하므로 더 많은 리소스를 필요로 합니다. 따라서 확장성이 엔터프라이즈급 데이터베이스에 미치지 못합니다.

3. 사용 사례

데이터 웨어하우스와 데이터베이스는 사용 사례 면에서 차이가 큽니다.

데이터베이스는 조직의 일상적인 작업에 필요한 소규모의 원자성 트랜잭션에 가장 유용합니다. 신규 환자에 관한 새로운 데이터를 입력하는 병원, 온라인 웹사이트를 통해 티켓을 구매하는 고객, 두 계좌 간에 송금을 하는 은행 등을 예로 들 수 있습니다.

데이터 웨어하우스는 보다 높은 수준의 분석이 필요하고 조직의 과거, 현재, 미래에 관련한 대규모 질문에 가장 적합합니다. 숨겨진 인사이트를 발굴하기 위해 여러 데이터베이스에서 정보를 마이닝하는 것을 예로 들 수 있습니다.

4. 서비스 수준 계약

OLTP 트랜잭션 특성으로 인해 데이터베이스는 일반적으로 거의 24시간 연중무휴, 99.9% 이상의 가용성을 요구합니다. OLTP 데이터베이스에 다운타임이 발생하는 경우 막대한 비용이 발생하고 심지어는 비즈니스가 중단될 수도 있습니다.

그러나 백엔드 분석에 더 자주 사용되는 데이터 웨어하우스에 있어서 다운타임은 큰 문제가 되지 않습니다. 사실 대부분의 데이터 웨어하우스에는 더 많은 정보가 업로드될 때 정기적으로 예약되어 있는 다운타임 기간이 있습니다.

5. 최적화

OLTP 데이터베이스는 신속한 CRUD 작업(생성, 읽기, 업데이트, 삭제)에 최적화되어 있습니다. 그러나 더욱 복잡한 분석 쿼리로 인해 성능이 빠르게 저하될 수 있습니다.

반면, OLAP 데이터 웨어하우스는 여러 개의 대규모 데이터 저장소에 걸쳐 발생하는 소규모의 복잡한 쿼리에 최적화되어 있습니다. 응답 시간도 중요한 메트릭이지만, 데이터 웨어하우스의 경우 데이터하우스가 수행하는 분석의 품질이 더욱 중요합니다.

6. 구조

신속한 쿼리라는 목표 달성을 위해 OLTP 데이터베이스는 여러 테이블에 정보가 중복되지 않고 최대한 효율적으로 구조화됩니다. 이를 통해 트랜잭션 실행에 필요한 디스크 공간과 응답 시간이 모두 줄어듭니다.

OLAP 데이터 웨어하우스의 경우 주어진 쿼리의 속도에 크게 신경을 쓰지 않기 때문에 중복 정보는 거의 문제가 되지 않습니다. 일반적으로 데이터 웨어하우스는 데이터를 비정규화하여 쓰기 작업보다 읽기 작업에 높은 우선 순위를 둡니다.

7. 보고 및 분석

OLTP 데이터베이스에서 일부 제한된 보고 및 분석이 가능하지만, 데이터의 정규화된 구조로 인해 수행하기 어려워집니다. 아울러 데이터베이스에는 효율성 극대화를 위해 주로 최신 정보만 포함되기 때문에 기록 쿼리가 불가능합니다.

반면 데이터 웨어하우스는 처음부터 보고 및 분석 목적으로 설계되었습니다. 따라서 사용자는 현재 및 기록 데이터를 모두 수집할 수 있으므로 광범위한 인사이트를 확보할 수 있습니다.

데이터 웨어하우스 및 데이터베이스와 데이터 마트 및 데이터 레이크 비교

데이터베이스와 데이터 웨어하우스 비교 관련 문제가 엔터프라이즈 데이터 관리 시스템에서 알아야 할 전부라고 생각했다면 오산입니다. 이 섹션에서는 조직에서 관심을 갖고 살펴볼 수 있는 데이터베이스와 데이터 웨어하우스의 두 가지 대안, 즉 데이터 마트와 데이터 레이크를 살펴보겠습니다.

데이터 마트의 정의 및 사용

데이터 마트는 특정 정보 유형이나 마케팅, 영업, 재무 또는 인사 등 조직 내 특정 사용자 집합을 위한 정보를 저장하는 것을 목적으로 하는 데이터베이스입니다.

데이터 마트는 자체 엔터티가 될 수도 있거나, 대규모 데이터 웨어하우스에 속한 소규모 파티션이 될 수도 있습니다. 두 경우 모두 조직의 데이터를 관리 가능한 크기(일반적으로 100기가바이트 미만)로 줄이는 것을 목표로 합니다.

데이터 레이크의 정의 및 사용

데이터 레이크는 데이터 웨어하우스와 유사하지만 데이터 내용의 체계화 방법에 대한 엄격한 요구 사항이 없습니다. 데이터 레이크는 중앙 집중식 데이터 스토리지의 한 방법으로서 어떠한 유형으로도 정보를 필연적으로 구조화하지는 않습니다. 구조화된 데이터와 구조화되지 않은 데이터가 함께 저장될 수 있으며, 데이터 레이크는 모든 소스나 데이터 유형의 정보를 사용할 수 있습니다.

데이터 레이크는 현재 및 과거 정보 모두에 대해 일종의 "하치장" 같은 측면이 있기 때문에 구조화된 데이터베이스보다 일반적으로 유연성과 적응성이 높습니다. 그러나 추후에 개발자와 분석가가 이러한 대량의 정보를 처리하고 사용하고자 할 때 그에 따른 불편을 감수해야 합니다.

데이터베이스와 데이터 웨어하우스 통합

데이터 마트와 데이터 레이크는 물론이고 데이터 웨어하우스와 데이터베이스의 비교 문제는 빅데이터를 사용하는 모든 비즈니스가 답해야 할 문제입니다. 위에서 살펴본 바와 같이 데이터베이스와 데이터 웨어하우스는 실제로 상당히 다릅니다. 데이터 웨어하우스 또는 데이터베이스를 설치하기로 결정한다는 것 자체가 조직이 우수한 엔터프라이즈 데이터 관리를 실천하기 위해 노력하고 있음을 나타냅니다.

데이터 종류를 막론하고 데이터 통합 병목 현상을 겪고 있다면, Integrate.io를 통해 ETL 프로세스(추출, 변환, 로드)를 자동화하고 데이터 웨어하우스와 데이터베이스를 통합하는 클라우드 기반의 시각적 로우 코드 인터페이스를 활용할 수 있습니다. 전화 상담을 예약하여 Integrate.io 구현 팀과 데모 세션, 7일 시범 세션, 무료 세션에 대한 일정을 계획해 보세요.