f2a

v1.1.1

File to Analysis

어떤 데이터 소스에서든 자동으로 기술 통계 분석과 시각화를 수행합니다. 23가지 분석 모듈과 6개국어 HTML 리포트를 지원합니다.

Python ≥ 3.10Apache-2.0

# Installation
$ pip install f2a
# or with uv
$ uv add f2a

핵심 기능

f2a가 제공하는 자동 데이터 분석 기능을 확인하세요.

23가지 분석 모듈

기술 통계, 상관 분석, 분포 분석, 이상치 탐지, PCA, 피처 중요도 등 23가지 분석 모듈을 자동으로 실행합니다.

24+ 파일 포맷

CSV, TSV, JSON, JSONL, Parquet, Excel, Feather, ORC 등 24가지 이상의 데이터 파일 형식을 지원합니다.

HuggingFace 통합

hf:// 프로토콜로 HuggingFace 데이터셋을 직접 분석할 수 있습니다. URL 기반 원격 데이터도 지원합니다.

6개국어 리포트

English, 한국어, 日本語, 中文, Deutsch, Français — 6개 언어로 분석 리포트를 생성합니다.

50+ 시각화

히스토그램, 박스플롯, 상관 히트맵, QQ플롯, 산점도 등 50가지 이상의 인터랙티브 시각화를 생성합니다.

HTML 리포트

분석 결과를 단일 HTML 파일로 출력합니다. 브라우저에서 바로 열어볼 수 있는 인터랙티브 리포트입니다.

지원 포맷

24가지 이상의 데이터 파일 형식을 처리할 수 있습니다.

구분자 기반

CSV, TSV

구조화

JSON, JSONL

바이너리

Parquet, Feather, ORC

스프레드시트

XLSX, XLS

원격

HTTP/HTTPS URL, HuggingFace datasets

코드 예제

3줄의 코드로 전체 데이터 분석을 수행하세요.

기본 분석

import f2a

report = f2a.analyze("data.csv")
report.to_html("./output")

# 자동으로 23가지 분석 + 50가지 시각화 생성

URL / HuggingFace 분석

import f2a

# HuggingFace 데이터셋 직접 분석
report = f2a.analyze(
    "hf://datasets/scikit-learn/iris",
    lang="ko"
)
report.to_html("output/")

분석 프리셋

import f2a

# Fast 프리셋 (PCA, 피처 중요도 제외)
config = f2a.AnalysisConfig.fast()

report = f2a.analyze(
    "large_data.parquet",
    config=config
)

분석 파이프라인

단일 함수 호출로 전체 분석 파이프라인이 실행됩니다.

데이터 로드

→

스키마 분석

→

기술 통계

→

시각화 생성

→

리포트 출력

f2a로 시작하세요

pip install f2a로 설치하고, 데이터를 자동으로 분석하세요.

GitHub 문서 보기