핵심 기능
f2a가 제공하는 자동 데이터 분석 기능을 확인하세요.
23가지 분석 모듈
기술 통계, 상관 분석, 분포 분석, 이상치 탐지, PCA, 피처 중요도 등 23가지 분석 모듈을 자동으로 실행합니다.
24+ 파일 포맷
CSV, TSV, JSON, JSONL, Parquet, Excel, Feather, ORC 등 24가지 이상의 데이터 파일 형식을 지원합니다.
HuggingFace 통합
hf:// 프로토콜로 HuggingFace 데이터셋을 직접 분석할 수 있습니다. URL 기반 원격 데이터도 지원합니다.
6개국어 리포트
English, 한국어, 日本語, 中文, Deutsch, Français — 6개 언어로 분석 리포트를 생성합니다.
50+ 시각화
히스토그램, 박스플롯, 상관 히트맵, QQ플롯, 산점도 등 50가지 이상의 인터랙티브 시각화를 생성합니다.
HTML 리포트
분석 결과를 단일 HTML 파일로 출력합니다. 브라우저에서 바로 열어볼 수 있는 인터랙티브 리포트입니다.
지원 포맷
24가지 이상의 데이터 파일 형식을 처리할 수 있습니다.
구분자 기반
CSV, TSV
구조화
JSON, JSONL
바이너리
Parquet, Feather, ORC
스프레드시트
XLSX, XLS
원격
HTTP/HTTPS URL, HuggingFace datasets
코드 예제
3줄의 코드로 전체 데이터 분석을 수행하세요.
기본 분석
import f2a
report = f2a.analyze("data.csv")
report.to_html("./output")
# 자동으로 23가지 분석 + 50가지 시각화 생성URL / HuggingFace 분석
import f2a
# HuggingFace 데이터셋 직접 분석
report = f2a.analyze(
"hf://datasets/scikit-learn/iris",
lang="ko"
)
report.to_html("output/")분석 프리셋
import f2a
# Fast 프리셋 (PCA, 피처 중요도 제외)
config = f2a.AnalysisConfig.fast()
report = f2a.analyze(
"large_data.parquet",
config=config
)분석 파이프라인
단일 함수 호출로 전체 분석 파이프라인이 실행됩니다.
1
데이터 로드2
스키마 분석3
기술 통계4
시각화 생성5
리포트 출력