@senspond

>

빅데이터/AI 🍎>데이터 사이언스

데이터 시각화를 하는 이유를 알아보고 데이터 시각화 도구들을 소개합니다.

등록일시 : 2024-01-25 (목) 09:31
업데이트 : 2024-01-26 (금) 05:40
오늘 조회수 : 1
총 조회수 : 525

    안녕하세요. 데이터 시각화를 하는 이유를 알아보고 데이터 시각화 도구들을 소개해보는 글을 작성해봅니다.

    안녕하세요. 데이터 시각화를 하는 이유를 알아보고 데이터 시각화 도구들을 소개해보는 글을 작성해봅니다.


    데이터 시각화를 하는 이유

    데이터 시각화는 데이터를 그래픽으로 나타내어 정보를 시각적으로 이해하고 전달하는 과정을 말합니다. 데이터 시각화를 하는 이유는 여러 가지가 있습니다:


    1. 패턴 및 관계 이해: 데이터 시각화를 통해 데이터의 패턴, 관계, 추세 등을 직관적으로 파악할 수 있습니다. 시각적 표현을 통해 숨겨진 구조나 특이점을 발견할 수 있습니다.

    2. 의사소통 강화: 시각화는 복잡한 데이터를 단순하고 명확하게 전달하는데 도움이 됩니다. 시각적인 자료는 다양한 수준의 이해자들 간에 효과적인 의사소통을 가능하게 합니다.

    3. 의사결정 지원: 시각화는 데이터 기반 의사결정을 지원합니다. 시각적으로 표현된 데이터를 통해 의사결정을 내리는 과정이 더 효과적으로 이루어질 수 있습니다.

    4. 인사이트 도출: 데이터 시각화를 통해 데이터에서 새로운 인사이트를 도출할 수 있습니다. 눈에 띄지 않았던 패턴이나 특성을 시각적으로 확인함으로써, 새로운 관점에서 문제를 바라볼 수 있습니다.

    5. 효율적인 데이터 탐색: 시각화는 대규모 데이터셋을 효율적으로 탐색하고 이해하는 데 도움이 됩니다. 그래픽으로 표현된 정보는 빠르게 스캔하고 중요한 부분을 발견할 수 있습니다.

    6. 품질 향상: 데이터 시각화를 통해 데이터의 품질 문제를 빠르게 감지하고 수정할 수 있습니다.


    요약하면, 데이터 시각화는 복잡한 데이터를 이해하고 다양한 사용자들에게 효과적으로 전달하며, 의사결정과 인사이트 도출을 지원하여 데이터 기반의 업무를 향상시키는 데 도움을 줍니다.


    다른 이유로는 직장에서 관리자들이 좋아합니다.


    대표적인 시각화 도구들(상용)

    데이터 분석하는 기업에서 많이 사용합니다. 많은 상용 소프트웨어들이 있는데, 그러한 강력한 툴들로 인해서 생각보다 현업에서는 직접 하드 코딩해서 데이터 시각화 할 일이 적은 것 같습니다.


    태블로(Tableau)

    Tableau는 데이터 시각화 및 비즈니스 인텔리전스 도구로, 사용자들이 데이터를 시각적으로 분석하고 이해하는 데 도움을 주는 강력한 소프트웨어입니다. Tableau를 사용하면 데이터를 다양한 그래픽 형식으로 시각화하고 인터랙티브한 대시보드를 생성할 수 있습니다.


    Microsoft Power BI

    Microsoft Power BI는 엑셀과 통합된 비즈니스 분석 도구로, 사용자들이 대화형 보고서 및 대시보드를 만들고 비즈니스 데이터를 시각화할 수 있도록 지원합니다. 강력한 연결 기능과 분석 도구를 제공합니다.


    FineReport

    FineReport (이하 파인리포트) 에서  간단한 드래그 앤 드롭만으로 주간, 월간, 연간 보고서를 손쉽게 만들어 줄 수 있고, 데이터 시각화 툴 로서 뿐만 아니라 데이터 의사결정 분석 시스템을 쉽게 구축할 수 있습니다. 


    DevExpress

    C++빌더, 델파이, C# 닷넷 환경에서 주로 윈도우 기반 응용 프로그램에 대시보드를 구성하고 시각화를 할때 강력한 UI들을 제공하는 상용 소프트웨어입니다. 요즘은 웹기반도 지원하는 것 같습니다. 그런데 굉장히 비싼 가격이 단점입니다. 예전에 의사선생님들이 사용하는 병원프로그램 개발을 했을때 잠시 다뤄보기는 했었습니다. 특수 분야 외에는 다뤄볼 일이 거의 없을것 같습니다.


    WEB 기반

    ApexChart, amChats, RealGrid, ZingChart 등등... 정말 다양한 상용 시각화 솔루션들이 있습니다. 회사에서 웹 개발하다보면 몇개 다루게 됩니다.


    대표적인 시각화 도구들(오픈소스)


    자바(Java)

    Gephi

    • Gephi는 NetBeans 플랫폼에서 Java로 작성된 오픈 소스 네트워크 분석 및 시각화 소프트웨어 패키지입니다

    • 대규모의 복잡한 네트워크 데이터를 시각화하고 탐색하는 데 특히 유용한 도구 중 하나입니다.

    이전에 다니던 소셜 빅데이터 회사에서 소셜 데이터의 네트워크 분석을 하고 시각화를 할때 사용하던 툴입니다. 주 업무는 아니다보니 많이 공부를 하지는 못했네요. 굉장히 복잡한 그래프 구조의 네트워크 분석에 특화 된 분석 및 시각화 툴을 제공하기도 하고 SDK JAVA API 를 제공하여 자바 프로그래밍을 통해 시각화 데이터를 뽑아낼 수 있다는 장점이 있습니다.


    JFreeChart

    • JFreeChart는 자바 기반의 오픈 소스 차트 라이브러리로, 다양한 종류의 차트를 생성할 수 있습니다.

    • 선 그래프, 막대 그래프, 원형 그래프, 히스토그램 등 다양한 차트 유형을 지원합니다.

    Java 로 GUI 개발을 해야 할때 고려해볼만 합니다. 하지만 UI가 옛날 프로그램 느낌납니다. 요즘은 GUI는 거의 웹기반으로 개발을 하니 거의 쓸일이 없다고 할 수 있겠습니다.


    자바스크립트(JavaScript)

    종류가 어마무시하게 많이 있습니다. 여기서는 오픈소스 기반의 대표적인 것들만 간단하게 정리해봅니다.

    D3JS

    • D3.js는 데이터 기반 시각화를 생성하기 위한 강력한 자바스크립트 라이브러리입니다.

    • 데이터와 DOM 요소를 바인딩하여 다양한 시각화를 생성할 수 있습니다.

    • 데이터와 시각적 요소 간의 매핑을 통해 유연하고 커스텀하여 맞춤형 시각화를 구현할 수 있습니다.

    오픈소스 자바스크립트 데이터 시각화의 끝판왕이라고 할 수 있습니다. 모든 유형의 차트를 내입맛대로 만들 수는 있지만 학습난이도가 상당히 있기 때문에... 그냥 상용 솔루션을 쓰는 것이 효율적일 수도 있겠습니다.



    chart.js

    • Chart.js는 간단하고 사용하기 쉬운 HTML5 기반 차트 라이브러리로, 라인 차트, 막대 차트, 원형 차트 등을 지원합니다.

    심플하고 다루기 쉽지만 복잡한 시각화를 구현 하기에는 지원되는 기능과 차트종류가 적어 한계가 있습니다. 간단한 개인 웹사이트 만들때 사용하기 좋습니다.


    Nivo

    • React 기반의 시각화로 내부적으로 D3JS 기반으로 만들어졌습니다.

    • 제공되는 그래프 형태가 상당히 많고 커스텀 마이징을 지원합니다.

    • 막대와 라인을 합친 Combined charts 등이 지원되지 않는 단점이 있습니다.


    Recharts

    현재 RgbitCode 이 웹사이트에서도 적용하고 있는 차트입니다. ㅎㅎ

    • Nivo 에 비해 많은 차트가 지원되지는 않지만 사용법이 간단하고 css 거의 안만져도 예쁩니다.

    • Combined charts 가 필요하며 그렇게까지 많이 복잡한 차트 까지는 필요없을 때 쓸만한것 같습니다.

    Plotly.js

    • Plotly는 인터랙티브한 시각화를 만들 수 있는 라이브러리입니다.

    • 기본적인 시각화부터 통계, 재무, 지리 과학 및 3-dimensional 을 포함한 40개 이상의 차트 타입을 제공하는 오픈소스 입니다



    파이썬(Python)

    파이썬에서는 다양한 시각화 라이브러리가 있습니다. 여러 라이브러리 중 몇 가지 대표적인 시각화 라이브러리를 소개하겠습니다:

    Matplotlib

    • Matplotlib은 파이썬의 가장 기본적이고 대표적인 시각화 라이브러리 중 하나입니다.

    • 2D 그래프 및 플롯을 생성하는데 사용됩니다.

    • 선 그래프, 막대 그래프, 히스토그램, 산점도 등 다양한 그래픽을 지원합니다.

    • 다른 시각화 도구의 기반이 되기도 합니다.


    Seaborn

    • Seaborn은 Matplotlib을 기반으로 한 통계 데이터 시각화 라이브러리입니다.

    • 간단한 코드로 통계적 그래픽을 생성할 수 있습니다.

    • 색상 팔레트와 같은 추가적인 기능을 제공합니다.

    • 간단한 데이터 분석을 위한 자체 내장 데이터를 가지고 있습니다.


    Plotly

    • Plotly는 본래 자바스크립트 구현된 plotly.ts 를 기반으로 R, 파이썬 등 다양한 언어에서 인터랙티브한 시각화를 만들 수 있도록 만든 라이브러리입니다.

    • 기본적인 시각화부터 통계, 재무, 지리 과학 및 3-dimensional 을 포함한 40개 이상의 차트 타입을 제공하는 오픈소스 입니다

    • 자바스크립트를 작성하지 않고도 자바스크립트를 쓰는 반응형 시각화를 만들어 웹 임베딩이 가능합니다.


    Bokeh

    • Bokeh는 반응형 시각화를 만드는데 사용되는 강력한 라이브러리입니다.

    • 웹 기반의 대시보드나 대화형 그래픽을 쉽게 생성할 수 있습니다.

    Matplotlib 은 정해진 크기의 그림 형식의 plot 을 그리지만, Bokeh 는 JavaScript 를 이용하는 HTML interactive plots 을 그립니다. plotly와 마찬가지로 자바스크립트를 작성하지 않고 자바스크립트를 쓰는 반응형 시각화를 만들 수 있습니다.



    다음에 세부적으로 더 자세하게 정리해보겠습니다.


    senspond

    안녕하세요. Red, Green, Blue 가 만나 새로운 세상을 만들어 나가겠다는 이상을 가진 개발자의 개인공간입니다.

    댓글 ( 0 )

    카테고리내 관련 게시글

    현재글에서 작성자가 발행한 같은 카테고리내 이전, 다음 글들을 보여줍니다

    @senspond

    >

    빅데이터/AI 🍎>데이터 사이언스

    • python seaborn 시작하기 - sample 데이터셋을 가지고 데이터 시각화 연습하는 방법소개

      이번 글은 seabon을 통해 파이썬 데이터분석 시각화 연습을 하는 방법을 소개해보고 시각화 하는 몇가지 방법들에 대해서 간략하게 정리해봅니다.
        2024-01-29 (월) 05:52
      1. [현재글] 데이터 시각화를 하는 이유를 알아보고 데이터 시각화 도구들을 소개합니다.

        안녕하세요. 데이터 시각화를 하는 이유를 알아보고 데이터 시각화 도구들을 소개해보는 글을 작성해봅니다.
          2024-01-25 (목) 09:31
        1. 서울시 부동산 실거래가 정보_2023 기반으로 한 파이썬 데이터 시각화 연습

          서울시 부동산 실거래가 정보_2023 기반으로 한 파이썬 데이터 시각화 연습해본 글입니다.
            2024-01-27 (토) 04:31