개요: 파이썬 데이터 도구 상자는 데이터 소스부터 데이터 시각화에 이르는 전체 과정에서 사용되는 일반적인 라이브러리, 함수 및 외부 도구를 포함합니다. 여기에는 파이썬 내장 함수와 표준 라이브러리뿐만 아니라 서드파티 라이브러리와 도구도 포함됩니다.
이러한 라이브러리는 파일 입출력, 웹 스크래핑 및 파싱, 데이터 연결, 데이터 정제 변환, 데이터 계산 및 통계 분석, 이미지 및 비디오 처리, 오디오 처리, 데이터 마이닝/머신러닝/딥러닝, 데이터 시각화, 상호 학습 및 통합 개발, 그리고 기타 파이썬 협력 데이터 작업 도구에 사용될 수 있습니다.
라이브러리와 도구의 출처와 유형을 구분하기 위해, 본문에서는 다음 방법을 통해 설명을 구분합니다:
- 파이썬 내장 함수: 파이썬에 기본으로 포함된 함수로, import 없이 직접 사용할 수 있습니다. 예를 들어 -3.2의 절대값을 계산하려면 abs 함수를 직접 사용하며, 방법은 다음과 같습니다:
절대값(-3.2)
- 파이썬 표준 라이브러리: 파이썬에 기본으로 포함된 표준 라이브러리입니다. 설치가 필요하지 않으며, 먼저 import 방식으로 가져와야 내부 메서드를 사용할 수 있습니다. 예를 들어 string 모듈을 가져온 후, 그 안의 find 메서드를 사용하는 방법은 다음과 같습니다:
import 문자열
문자열.찾기('abcde','b')
-
서드파티 라이브러리: 파이썬의 서드파티 라이브러리로, 이러한 라이브러리는 먼저 설치해야 합니다(일부는 구성이 필요할 수 있습니다).
-
외부 도구: 파이썬으로 작성되지 않은 라이브러리나 패키지로, 파이썬 데이터 작업과 관련된 도구입니다.
「추천도」 3점이 가장 높고, 1점이 가장 낮습니다.
01 파일 입출력
파일 입출력에는 일반적인 txt, Excel, xml, 바이너리 파일 및 기타 형식의 데이터 텍스트가 포함되며, 주로 로컬 데이터 입출력에 사용됩니다.
1. open(name[, mode[, buffering]])
- 유형: 파이썬 내장 함수
- 설명: 파이썬 기본 파일 입출력 방법
- 추천도: ★★★
2. numpy.loadtxt, numpy.load 및 numpy.fromfile
- 유형: 서드파티 라이브러리
- 설명: NumPy에 내장된 입출력 함수로, loadtxt, load 및 fromfile가 포함되며, 텍스트 및 바이너리 파일 입출력에 사용됩니다
- 추천도: ★★★
3. pandas.read_*
- 유형: 서드파티 라이브러리
- 설명: Pandas에 내장된 read 파일 방법으로, 예를 들어 read_csv, read_fwf, read_table 등이 있으며, 텍스트, Excel, 바이너리 파일, HDF5, 표, SAS 파일, SQL 데이터베이스, Stata 파일 등의 입출력에 사용됩니다
- 추천도: ★★★
4. xlrd
- 유형: 서드파티 라이브러리
- 설명: Excel 파일 읽기에 사용
- 추천도: ★★
5. xlwt
- 유형: 서드파티 라이브러리
- 설명: Excel 파일 쓰기에 사용
- 추천도: ★★
6. pyexcel-xl
- 유형: 서드파티 라이브러리
- 설명: Excel 파일 입출력에 사용
- 추천도: ★★
7. xlutils
- 유형: 서드파티 라이브러리
- 설명: Excel 파일 입출력에 사용
- 추천도: ★★
8. pyExcelerator
- 유형: 서드파티 라이브러리
- 설명: Excel 파일 입출력에 사용
- 추천도: ★
9. openpyxl
- 유형: 서드파티 라이브러리
- 설명: Excel 파일 입출력에 사용
- 추천도: ★
10. lxml
- 유형: 서드파티 라이브러리
- 설명: xml 및 HTML 읽기 및 파싱
- 추천도: ★★★
11. xml
- 유형: 파이썬 표준 라이브러리
- 설명: xml 객체 파싱 및 포맷팅 처리
- 추천도: ★★★
12. libxml2
- 유형: 서드파티 라이브러리
- 설명: xml 객체 파싱 및 포맷팅 처리
- 추천도: ★
13. xpath
- 유형: 서드파티 라이브러리
- 설명: xml 객체 파싱 및 포맷팅 처리
- 추천도: ★★
14. win32com
- 유형: 서드파티 라이브러리
- 설명: Windows 시스템 작업, Office(Word, Excel 등) 파일 입출력 등의 종합 응용 라이브러리
- 추천도: ★
02 웹 스크래핑 및 파싱
웹 스크래핑 및 파싱은 인터넷에서 정보를 수집하고 HTML 객체를 처리하는 데 사용됩니다. xml 객체 파싱 및 처리 라이브러리는 "01 파일 입출력"에서 찾을 수 있습니다.
15. requests
- 유형: 서드파티 라이브러리
- 설명: 네트워크 요청 라이브러리로, 다양한 네트워크 요청 방법을 제공하고 복잡한 전송 정보를 정의할 수 있습니다
- 추천도: ★★★
16. urllib
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 라이브러리로, 특정 URL을 읽고 반환 정보를 얻는 간단한 기능을 제공합니다
- 추천도: ★★
17. urllib2
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 라이브러리로, 특정 URL을 읽고 반환 정보를 얻으며, urllib보다 더 많은 HTTP 정보를 처리할 수 있습니다(예: 쿠키, 인증, 리디렉션 등)
- 추천도: ★★
18. urlparse
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 URL 파싱 라이브러리로, URL의 다양한 도메인, 매개변수, 경로 등을 자동으로 파싱할 수 있습니다
- 추천도: ★★★
19. HTMLParser
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 HTML 파싱 모듈로, HTML 파일 분석을 쉽게 구현할 수 있습니다
- 추천도: ★★★
20. Scapy
- 유형: 서드파티 라이브러리
- 설명: 분산형 웹 스크래핑 프레임워크로, 사용자가 네트워크 패킷을 전송, 수신 및 파싱하고 가장할 수 있으며, 대규모 네트워크 데이터 스크래핑에 주로 사용됩니다
- 추천도: ★★★
21. Beautiful Soup
- 유형: 서드파티 라이브러리
- 설명: Beautiful Soup는 웹페이지 데이터 파싱 및 포맷팅 처리 도구로, 일반적으로 파이썬의 urllib, urllib2 등 라이브러리와 함께 사용됩니다
- 추천도: ★★★
03 데이터베이스 연결
데이터베이스 연결은 다양한 데이터베이스에 연결하고 일반 데이터베이스 인터페이스에 접근하는 데 사용되며, 데이터베이스 유지 관리 및 관리, 그리고 일상적인 작업(추가, 삭제, 수정, 조회)에 사용될 수 있습니다.
22. mysql-connector-python
- 유형: 서드파티 라이브러리
- 설명: MySQL 공식 드라이버 연결 프로그램
- 추천도: ★★★
23. pymysql
- 유형: 서드파티 라이브러리
- 설명: MySQL 연결 라이브러리로, Python3 지원
- 추천도: ★★★
24. MySQL-python
- 유형: 서드파티 라이브러리
- 설명: MySQL 연결 라이브러리
- 추천도: ★★
25. cx_Oracle
- 유형: 서드파티 라이브러리
- 설명: Oracle 연결 라이브러리
- 추천도: ★★★
26. psycopg2
- 유형: 서드파티 라이브러리
- 설명: Python 프로그래밍 언어에서 매우 인기 있는 PostgreSQL 어댑터
- 추천도: ★★★
27. redis
- 유형: 파이썬 표준 라이브러리
- 설명: Redis 연결 라이브러리
- 추천도: ★★★
28. pymongo
- 유형: 서드파티 라이브러리
- 설명: MongoDB 공식 드라이버 연결 프로그램
- 추천도: ★★★
29. HappyBase
- 유형: 서드파티 라이브러리
- 설명: HBase 연결 라이브러리
- 추천도: ★★★
30. py2neo
- 유형: 서드파티 라이브러리
- 설명: Neo4j 연결 라이브러리
- 추천도: ★★★
31. cassandra-driver
- 유형: 서드파티 라이브러리
- 설명: Cassandra(1.2+) 및 DataStax Enterprise(3.1+) 연결 라이브러리
- 추천도: ★★★
32. sqlite3
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 모듈로, SQLite 데이터베이스 작업에 사용됩니다
- 추천도: ★★★
33. pysqlite2
- 유형: 서드파티 라이브러리
- 설명: SQLite 3.x 연결 라이브러리
- 추천도: ★★
34. bsddb3
- 유형: 서드파티 라이브러리
- 설명: Berkeley DB 연결 라이브러리
35. bsddb
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 모듈로, Berkeley DB 라이브러리에 대한 인터페이스를 제공합니다
- 추천도: ★★
36. dbhash
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 모듈로, dbhash 모듈은 BSD 데이터베이스 라이브러리를 사용하여 데이터베이스를 열기 위한 기능을 제공합니다. 이 모듈은 다른 Python 데이터베이스 모듈이 DBM 스타일 데이터베이스 액세스를 제공하는 인터페이스를 반영합니다. bsddb 모듈은 dbhash가 필요합니다
- 추천도: ★★
37. adodb
- 유형: 서드파티 라이브러리
- 설명: ADOdb는 데이터베이스 추상 라이브러리로, 일반적인 데이터 및 데이터베이스 인터페이스를 지원하고 데이터베이스 확장을 직접 수행할 수 있으며, 이 라이브러리는 다양한 데이터베이스의 구문을 파싱하고 차별화 처리할 수 있어 높은 일반성을 가집니다
- 추천도: ★★★
38. SQLObject
- 유형: 서드파티 라이브러리
- 설명: SQLObject는 인기 있는 객체 관계 관리자로, 데이터베이스에 객체 인터페이스를 제공하며, 테이블은 클래스이고 동작은 인스턴스이며 열은 속성입니다
- 추천도: ★★
39. SQLAlchemy
- 유형: 서드파티 라이브러리
- 설명: SQLAlchemy는 Python SQL 도구 키트 및 객체 관계 매핑기로, 애플리케이션 개발자에게 SQL의 모든 기능과 유연성 제어를 제공합니다
- 추천도: ★★
40. ctypes
- 유형: 서드파티 라이브러리
- 설명: ctypes는 Python의 외부 라이브러리로, C 언호와 호환되는 데이터 유형을 제공하며, C DLL의 함수를 쉽게 호출할 수 있습니다
- 추천도: ★★★
41. pyodbc
- 유형: 서드파티 라이브러리
- 설명: Python이 ODBC를 통해 데이터베이스에 접근하는 인터페이스 라이브러리
- 추천도: ★★★
42. Jython
- 유형: 서드파티 라이브러리
- 설명: Python이 JDBC를 통해 데이터베이스에 접근하는 인터페이스 라이브러리
- 추천도: ★★
04 데이터 정제 변환
데이터 정제 변환은 주로 데이터를 실제로 적용하기 전의 사전 작업에 사용됩니다.
43. frozenset([iterable])
- 유형: 파이썬 내장 함수
- 설명: 새로운 frozenset 객체를 반환하며, 선택적으로 iterable에서 가져온 요소를 포함할 수 있습니다
- 추천도: ★★★
44. int(x)
- 유형: 파이썬 내장 함수
- 설명: x의 정수 부분을 반환합니다
- 추천도: ★★★
45. isinstance(object, classinfo)
- 유형: 파이썬 내장 함수
- 설명: object가 지정된 classinfo의 인스턴스 정보인지 반환합니다
- 추천도: ★★★
46. len(s)
- 유형: 파이썬 내장 함수
- 설명: 객체의 길이 또는 항목 수를 반환합니다
- 추천도: ★★★
47. long(x)
- 유형: 파이썬 내장 함수
- 설명: 문자열 또는 숫자 x에서 구성된 긴 정수 객체를 반환합니다
- 추천도: ★★★
48. max(iterable[, key])
- 유형: 파이썬 내장 함수
- 설명: 반복 가능한 객체 또는 두 개 이상의 인수 중 최대 항목을 반환합니다
- 추천도: ★★★
49. min(iterable[, key])
- 유형: 파이썬 내장 함수
- 설명: 반복 가능한 객체 또는 두 개 이상의 인수 중 최소 항목을 반환합니다
- 추천도: ★★★
50. range(start, stop[, step])
- 유형: 파이썬 내장 함수
- 설명: for 루프와 함께 사용하여 루프 목록을 만드는 데 사용되며, start(시작), stop(끝) 및 step(간격)을 지정하여 반복 횟수를 제어하고 루프 값을 가져옵니다
- 추천도: ★★★
51. raw_input(prompt)
- 유형: 파이썬 내장 함수
- 설명: 사용자 입력을 캡처하여 문자열로 반환합니다(input을 사용자 입력 캡처 함수로 사용하는 것은 권장되지 않습니다)
- 추천도: ★★★
52. round(number[, ndigits])
- 유형: 파이썬 내장 함수
- 설명: number를 소수점 이하 ndigits 자리에서 반올림한 부동 소수점 수를 반환합니다
- 추천도: ★★★
53. set([iterable])
- 유형: 파이썬 내장 함수
- 설명: 새로운 집합 객체를 반환하며, 선택적으로 iterable에서 가져온 요소를 포함할 수 있습니다
- 추천도: ★★★
54. slice(start, stop[, step])
- 유형: 파이썬 내장 함수
- 설명: 범위(start, stop, step)로 지정된 인덱스 집합을 나타내는 슬라이스 객체를 반환합니다
- 추천도: ★★
55. sorted(iterable[, cmp[, key[, reverse]]])
- 유형: 파이썬 내장 함수
- 설명: iterable의 항목에서 새로 정렬된 목록을 반환합니다
- 추천도: ★★★
56. xrange(start, stop[, step])
- 유형: 파이썬 내장 함수
- 설명: 이 함수는 range()와 매우 유사하지만 목록 대신 xrange 객체를 반환합니다
- 추천도: ★★★
57. 문자열
- 유형: 파이썬 표준 라이브러리
- 설명: 문자열 처리 라이브러리로, 문자열 검색, 분할, 결합, 교체, 중복 제거, 대소문자 변환 및 기타 포맷팅 처리를 구현할 수 있습니다
- 추천도: ★★★
58. 정규식
- 유형: 파이썬 표준 라이브러리
- 설명: 텍스트 및 문자열 처리에서 자주 사용되는 정규식 모듈
- 추천도: ★★★
59. 무작위
- 유형: 파이썬 표준 라이브러리
- 설명: 이 모듈은 다양한 분포에 대한 의사 난수 생성기를 구현하며, 데이터 균일 분포, 정규(가우시안) 분포, 로그 정규 분포, 음의 지수 분포, 감마 및 베타 분포 등을 지원합니다
- 추천도: ★★★
60. 운영체제
- 유형: 파이썬 표준 라이브러리
- 설명: 새로 만들기, 삭제, 권한 수정, 경로 전환 등 디렉토리 작업, 그리고 시스템 명령 실행을 위한 모듈
- 추천도: ★★★
61. os.path
- 유형: 파이썬 표준 라이브러리
- 설명: 디렉토리 순회, 결합, 분할, 판단 등 작업을 위한 모듈로, 주로 데이터 파일의 판단, 검색, 병합에 사용됩니다
- 추천도: ★★★
62. prettytable
- 유형: 파이썬 표준 라이브러리
- 설명: 포맷된 표 출력 모듈
- 추천도: ★★
63. json
- 유형: 파이썬 표준 라이브러리
- 설명: Python 객체와 json 객체 간의 변환
- 추천도: ★★★
64. base64
- 유형: 파이썬 표준 라이브러리
- 설명: 임의의 이진 문자열을 Base16, Base32 및 Base64 텍스트 문자열로 인코딩 및 디코딩
- 추천도: ★★★
05 데이터 계산 및 통계 분석
데이터 계산 및 통계 분석은 주로 데이터 탐색, 계산 및 초기 데이터 분석 작업에 사용됩니다.
65. numpy
- 유형: 서드파티 라이브러리
- 설명: NumPy는 Python 과학 계산의 기본 도구 키트로, 많은 Python 데이터 계산 작업 라이브러리가 이에 의존합니다
- 추천도: ★★★
66. scipy
- 유형: 서드파티 라이브러리
- 설명: Scipy는 과학 및 공학 계산의 다양한 시나리오를 해결하기 위한 전용 도구 키트 세트입니다
- 추천도: ★★★
67. pandas
- 유형: 서드파티 라이브러리
- 설명: Pandas는 Python 데이터 분석을 위한 라이브러리로, 주로 데이터 분석에 사용됩니다. Pandas는 구조화된 데이터 분석을 위한 2차원 표 형식 데이터 구조 DataFrame을 제공하며, 이는 R의 데이터 프레임과 유사하며 데이터베이스의 슬라이싱, 큐빙, 집계, 서브셀 선택 등과 같은 정교한 작업을 제공하여 데이터 분석에 편의성을 제공합니다
- 추천도: ★★★
68. statsmodels
- 유형: 서드파티 라이브러리
- 설명: Statsmodels는 Python의 통계 모델링 및 계량 경제학 도구 키트로, 일부 기술적 통계, 통계 모델 추정 및 통계 검정을 포함하며, 다양한 선형 회귀 모델, 일반화 선형 회귀 모델, 이산 데이터 분포 모델, 시계열 분석 모델, 비모수 추정, 생존 분석, 주성분 분석, 커널 밀도 추정 및 광범위한 통계 검정 및 플롯 기능을 통합합니다
- 추천도: ★★★
69. abs(x)
- 유형: 파이썬 내장 함수
- 설명: x의 절대값을 반환합니다
- 추천도: ★★★
70. 비교(x, y)
- 유형: 파이썬 내장 함수
- 설명: 두 객체 x와 y를 비교하고 결과에 따라 정수를 반환합니다. x < y이면 음수 값을 반환하고, x == y이면 0을 반환하며, x > y이면 양수 값을 반환합니다
- 추천도: ★★
71. float(x)
- 유형: 파이썬 내장 함수
- 설명: 숫자 또는 문자열 x에서 구성된 부동 소수점 수를 반환합니다
- 추천도: ★★★
72. pow(x, y[, z])
- 유형: 파이썬 내장 함수
- 설명: x의 y제곱을 반환합니다. z가 있으면 x의 y제곱을 z로 나눈 나머지를 반환합니다
- 추천도: ★★★
73. 합계(iterable[, start])
- 유형: 파이썬 내장 함수
- 설명: 왼쪽에서 오른쪽으로 반복하여 합계를 반환합니다
- 추천도: ★★★
74. 수학
- 유형: 파이썬 표준 라이브러리
- 설명: 수학 함수 라이브러리로, 사인, 코사인, 탄젠트, 코탄젠트, 라디안 변환, 로그 연산, 원주율, 절대값, 반올림 등 수학 계산 방법을 포함합니다
- 추천도: ★★★
75. cmath
- 유형: 파이썬 표준 라이브러리
- 설명: math와 기본적으로 동일하며, 차이점은 cmath가 복소수를 연산한다는 것입니다
- 추천도: ★★
76. 십진수
- 유형: 파이썬 표준 라이브러리
- 설명: 10진수 부동 소수점 연산
- 추천도: ★★
77. 분수
- 유형: 파이썬 표준 라이브러리
- 설명: 분수 모듈은 유리수 산술에 대한 지원을 제공합니다
- 추천도: ★★
06 자연어 처리 및 텍스트 마이닝
자연어 처리 및 텍스트 마이닝 라이브러리는 주로 자연어 텍스트를 객체로 하는 데이터 처리 및 모델링에 사용됩니다.
78. nltk
- 유형: 서드파티 라이브러리
- 설명: NLTK는 Python 자연어 처리 도구로, 자연어 분류, 구문 분석 및 의미 이해에 사용됩니다. 현재 50개 이상의 말뭉치 및 어휈 자원이 있습니다
- 추천도: ★★★
79. 패턴
- 유형: 서드파티 라이브러리
- 설명: Pattern은 웹 데이터 마이닝 Python 도구 키트로, 웹 마이닝(웹 서비스, 웹 스크래퍼 등), 자연어 처리(품사 태깅, 감성 분석 등), 머신러닝(벡터 공간 모델, 분류 모델 등), 그래픽 네트워크 분석 모델을 위한 기능을 제공합니다
- 추천도: ★★★
80. gensim
- 유형: 서드파티 라이브러리
- 설명: Gensim는 전문적인 주제 모델링(텍스트에 내재된 주제를 발견하는 통계 모델링 방법) Python 도구 키트로, 확장 가능한 통계 의미, 순 텍스트 의미 구조 분석 및 의미적으로 유사한 문서 검색을 제공하는 데 사용됩니다
- 추천도: ★★★
81. 제바 분석
- 유형: 서드파티 라이브러리
- 설명: 제바 분석은 국내 인기 있는 Python 텍스트 처리 도구 키트로, 분석 모드는 세 가지 모드로 나뉩니다: 정확 모드, 전체 모드 및 검색 엔진 모드, 중국어 분석, 사용자 정의 사전 등을 지원하며 매우 좋은 Python 중국어 분석 솔루션으로, 분석, 사전 관리, 키워드 추출, 품사 태깅 등을 구현할 수 있습니다
- 추천도: ★★★
82. SnowNLP
- 유형: 서드파티 라이브러리
- 설명: SnowNLP는 Python으로 작성된 클래스 라이브러리로, 중국어 텍스트 콘텐츠를 쉽게 처리할 수 있습니다. 이 라이브러리는 TextBlob에서 영감을 받아 중국어 처리를 위해 작성된 클래스 라이브러리이며, TextBlob와 다르게 NLTK를 사용하지 않고 모든 알고리즘을 직접 구현했으며, 일부 미리 학습된 사전을 함께 제공합니다
- 추천도: ★★
83. smallseg
- 유형: 서드파티 라이브러리
- 설명: Smallseg는 오픈 소스 기반의 DFA 경량 중국어 분석 도구 키트입니다. 사용자 정의 사전, 분할 후 로그인 단어 목록 및 미등록 단어 목록 반환, 특정 신규 단어 인식 기능을 지원합니다
- 추천도: ★★
84. spaCy
- 유형: 서드파티 라이브러리
- 설명: spaCy는 Python 자연어 처리 도구 키트로, Python과 Cython을 결합하여 산업 수준의 자연어 처리 능력을 구현합니다
- 추천도: ★★★
85. TextBlob
- 유형: 서드파티 라이브러리
- 설명: TextBlob는 텍스트 데이터를 처리하는 Python 라이브러리로, 품사 태깅, 감성 분석, 텍스트 번역, 명사 구문 추출, 텍스트 분류 등에 사용할 수 있습니다
- 추천도: ★★
86. PyNLPI
- 유형: 서드파티 라이브러리
- 설명: PyNLPI는 다양한 자연어 처리 작업에 적합한 집합 라이브러리로, 중국어 텍스트 분석, 키워드 분석 등에 사용할 수 있으며, 특히 중영 매핑을 지원하고 UTF-8 및 GBK 인코딩 문자열을 지원하는 등 중요한 기능을 가집니다
- 추천도: ★★★
87. 동의어
- 유형: 서드파티 라이브러리
- 설명: 중국어 동의어 도구 키트로, 자연어 이해의 많은 작업에 사용할 수 있습니다: 텍스트 정렬, 추천 알고리즘, 유사도 계산, 의미 이동, 키워드 추출, 개념 추출, 자동 요약, 검색 엔진 등
- 추천도: ★★★
07 이미지 및 비디오 처리
이미지 처리 및 비디오 처리는 주로 얼굴 인식, 이미지 인식, 객체 추적, 이미지 이해 등 기반 이미지 작업, 처리, 분석 및 마이닝에 적용됩니다.
88. PIL/Pillow
- 유형: 서드파티 라이브러리
- 설명: PIL은 일반적으로 사용되는 이미지 읽기, 처리 및 분석 라이브러리로, 다양한 데이터 처리 및 변환 작업 방법과 속성을 제공합니다. PIL은 2.7 버전만 지원하며 오랫동안 업데이트되지 않았고, 자원봉사자들이 PIL을 기반으로 새로운 분기인 Pillow를 출시했습니다. Pillow는 Python2와 Python3를 동시에 지원하며 많은 새로운 기능이 추가되었습니다
- 추천도: ★★
89. OpenCV
- 유형: 서드파티 라이브러리
- 설명: OpenCV는 강력한 이미지 및 비디오 작업 라이브러리입니다. 다양한 프로그램 인터페이스를 제공하며 크로스 플랫폼(모바일 포함) 애플리케이션을 지원합니다. OpenCV는 설계 효율성이 높으며, 최적화된 C/C++로 작성되었고 라이브러리는 다중 코어 처리를 활용할 수 있습니다. 기본 이미지 처리 외에도 이미지 데이터 모델링을 지원하며 얼굴 인식과 같은 다양한 이미지 인식 엔진을 미리 제공합니다
- 추천도: ★★★
90. scikit-image
- 유형: 서드파티 라이브러리
- 설명: scikit-image(또는 skimage)는 이미지 처리 라이브러리로, 색상 모드 변환, 필터, 드로잉, 이미지 처리, 특징 검색 등 다양한 기능을 지원합니다
- 추천도: ★★
91. imageop
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, 이미지 기본 작업(잘라내기, 크기 조정, 모드 변환)을 수행할 수 있습니다
- 추천도: ★
92. colorsys
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, 다양한 이미지 색상 모드 변환을 구현합니다
- 추천도: ★
93. imghdr
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, 이미지 파일의 유형을 반환합니다
- 추천도: ★
08 오디오 처리
오디오 처리는 주로 음성 인식, 음성 합성, 의미 이해 등 기반 음성 처리, 분석 및 모델링에 적용됩니다.
94. TimeSide
- 유형: 서드파티 라이브러리
- 설명: TimeSide는 오디오 분석, 이미징, 인코딩, 스트리밍 및 태그 처리를 수행할 수 있는 Python 프레임워크로, 어떤 오디오나 비디오 콘텐츠에 대도 매우 큰 데이터 세트에 대한 복잡한 처리를 수행할 수 있습니다
- 추천도: ★★★
95. audiolazy
- 유형: 서드파티 라이브러리
- 설명: audiolazy는 실시간 음성 데이터 스트림 처리를 위한 라이브러리로, 실시간 데이터 응용 처리, 무한 데이터 시퀀스 표현, 데이터 스트림 표현 등을 지원합니다
- 추천도: ★★
96. pydub
- 유형: 서드파티 라이브러리
- 설명: pydub는 다양한 형식의 음성 파일을 지원하며, 다양한 신호 처리(예: 압축, 균형 조정, 정규화), 신호 생성(예: 사인, 방파, 톱니파 등), 사운드 효과 등록, 무음 처리 등을 수행할 수 있습니다
- 추천도: ★★★
97. audioop
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, 음성 조각의 일반적인 작업을 구현할 수 있습니다
- 추천도: ★★
98. tinytag
- 유형: 서드파티 라이브러리
- 설명: tinytag는 다양한 음성 파일의 메타데이터를 읽는 데 사용되며, MP3, OGG, OPUS, MP4, M4A, FLAC, WMA, Wave 등 형식을 포함합니다
- 추천도: ★★
99. aifc
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, AIFF 및 AIFC 파일 읽기 및 쓰기
- 추천도: ★
100. sunau
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, Sun AU 파일 읽기 및 쓰기
- 추천도: ★
101. wave
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, WAV 파일 읽기 및 쓰기
- 추천도: ★★
102. chunk
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, EA IFF 85 블록 형식의 파일 읽기
- 추천도: ★
103. sndhdr
- 유형: 파이썬 표준 라이브러리
- 설명: 파이썬에 기본 포함된 함수로, 음성 파일의 유형을 반환합니다
- 추천도: ★
104. ossaudiodev
- 유형: 파이썬 표준 라이브러리
- 설명: 이 모듈은 OSS(개방형 음성 시스템) 오디오 인터페이스 접근을 지원합니다
- 추천도: ★★★
09 데이터 마이닝/머신러닝/딥러닝
데이터 마이닝, 머신러닝 및 딥러닝은 Python을 사용한 데이터 모델링 및 마이닝 학습의 핵심 모듈입니다.
105. Scikit-Learn
- 유형: 서드파티 라이브러리
- 설명: scikit-learn(또는 SKlearn)은 Python 기반의 머신러닝 종합 라이브러리로, 내장 지도 학습 및 비지도 학습 머신러닝 방법을 포함하며, 다양한 회귀, 클러스터링, 분류, 스트림 학습, 이상 검출, 신경망, 집계 방법 등 주요 알고리즘 범주를 포함합니다. 동시에 미리 정의된 데이터 세트, 데이터 전처리, 모델 선택 및 평가 방법을 지원하며, 매우 완전하고 인기 있는 머신러닝 도구 라이브러리입니다
- 추천도: ★★★
106. TensorFlow
- 유형: 서드파티 라이브러리
- 설명: TensorFlow는 구글의 2세대 머신러닝 시스템으로, 내장 딥러닝 확장 지원을 포함하며, 계산 흐름 그래프로 표현할 수 있는 모든 계산을 TensorFlow 사용할 수 있습니다
- 추천도: ★★★
107. NuPIC
- 유형: 서드파티 라이브러리
- 설명: NuPIC은 HTM(계층적 시간 기억) 학습 알고리즘을 도구로 하는 머신 인텔리전스 플랫폼입니다. NuPIC은 다양한 문제에 적합하며, 특히 이상 감지 및 예측 응용에 적합합니다
- 추천도: ★★★
108. PyTorch
- 유형: 서드파티 라이브러리
- 설명: PyTorch는 페이스북이 출시한 딥러닝 프레임워크로, Python(아니면 lua) 기반으로 생성되며, 제공하는 동적 계산 그래프는 Tensorflow 등 다른 학습 프레임워크와의 중요한 차이점입니다
- 추천도: ★★
109. Orange
- 유형: 서드파티 라이브러리
- 설명: Orange는 그래픽 작업 인터페이스를 통해 대화형 데이터 분석 기능을 제공하며, 특히 분류, 클러스터링, 회귀, 특징 선택 및 교차 검증 작업에 적합합니다
- 추천도: ★★★
110. theano
- 유형: 서드파티 라이브러리
- 설명: Theano는 매우 성숙한 딥러닝 라이브러리입니다. Numpy와 긴밀하게 통합되며 GPU 계산, 단위 테스트 및 자체 검증을 지원합니다
- 추천도: ★★★
111. keras
- 유형: 서드파티 라이브러리
- 설명: Keras는 Python으로 작성된 고급 신경망 API로, TensorFlow 또는 Theano 위에서 실행될 수 있으며, 개발重点是 빠른 실험 구현에 중점을 둡니다
- 추천도: ★★
112. neurolab
- 유형: 서드파티 라이브러리
- 설명: Neurolab는 유연한 네트워크 구성과 Python 학습 알고리즘을 갖춘 기본 신경망 알고리즘 라이브러리입니다. 순환 신경망(RNN) 구현을 포함하는 다양한 변체를 포함하며, 이 라이브러리는 동일한 RNN API 중 최상의 선택지 중 하나입니다
- 추천도: ★★
113. PyLearn2
- 유형: 서드파티 라이브러리
- 설명: PyLearn2는 Theano 기반의 딥러닝 라이브러리로, 큰 유연성을 제공하고 연구자들이 자유로운 제어를 할 수 있도록 설계되었습니다. 매우 유연하고 개방적인 매개변수 및 속성 구성이 특징입니다
- 추천도: ★★★
114. OverFeat
- 유형: 서드파티 라이브러리
- 설명: OverFeat는 이미지 분류, 위치 객체 감지에 주로 사용되는 딥러닝 라이브러리입니다
- 추천도: ★★
115. Pyevolve
- 유형: 서드파티 라이브러리
- 설명: Pyevolve는 완전한 유전 알고리즘 프레임워크로, 유전 프로그래밍도 지원합니다
- 추천도: ★★
116. Caffe2
- 유형: 서드파티 라이브러리
- 설명: Caffe2는 페이스북이 출시한 또 다른 딥러닝 프레임워크로, PyTorch보다 연구에 더 적합하며 Caffe2는 대규모 배포에 적합하며 주로 컴퓨터 비전에 사용되며 이미지 인식 분류에 좋은 응용 효과를 가집니다
- 추천도: ★★
10 데이터 시각화
데이터 시각화는 주로 데이터 결과 표시, 데이터 모델 검증, 그래픽 상호 작용 및 탐색 등에 사용됩니다.
117. Matplotlib
- 유형: 서드파티 라이브러리
- 설명: Matplotlib는 Python의 2D 플로팅 라이브러리로, 다양한 하드 카피 형식 및 크로스 플랫폼 대화형 환경에서 출판 수준의 그래픽을 생성하며, 개발자는 몇 줄의 코드만으로 다양한 고품질 그래픽을 생성할 수 있습니다
- 추천도: ★★★
118. pyecharts
- 유형: 서드파티 라이브러리
- 설명: 바이두 Echarts 기반의 강력한 시각화 도구 라이브러리로, 제공되는 그래픽 기능이 많으며 특히 복잡한 관계 표시 능력이 강합니다
- 추천도: ★★★
119. seaborn
- 유형: 서드파티 라이브러리
- 설명: Seaborn은 Matplotlib을 기반으로 더 고급 API 캡슐화를 수행하며, Matplotlib의 보완 기능으로 사용할 수 있습니다
- 추천도: ★★★
120. bokeh
- 유형: 서드파티 라이브러리
- 설명: Bokeh는 웹 브라우저에서 아름다운 시각적 효과를 구현할 수 있는 대화식 시각화 라이브러리입니다
- 추천도: ★★★
121. Plotly
- 유형: 서드파티 라이브러리
- 설명: Plotly가 제공하는 그래픽 라이브러리는 온라인 웹 상호 작용을 수행할 수 있으며 출판 품질의 그래픽을 제공하며, 선 그래프, 산점도, 영역 그래프, 막대 그래프, 오차 막대, 상자 그림, 히스토그램, 히트맵, 서브플롯, 다중 축, 극좌표 그래프, 버블 차트, 장미 차트, 히트맵, 깔때기 차트 등 다양한 그래프를 지원합니다
- 추천도: ★★★
122. VisPy
- 유형: 서드파티 라이브러리
- 설명: VisPy는 대화형 과학 시각화를 위한 Python 라이브러리로, 빠르고 확장 가능하며 사용하기 쉽도록 설계되었습니다
- 추천도: ★★
123. PyQtGraph
- 유형: 서드파티 라이브러리
- 설명: PyQtGraph는 PyQt4/PySide 및 numpy 위에 구축된 순수 Python 그래픽 및 GUI 라이브러리로, 주로 수학/과학/공학 응용에 사용됩니다
- 추천도: ★★
124. ggplot
- 유형: 서드파티 라이브러리
- 설명: ggplot은 Python으로 구현된 그래픽 출력 라이브러리로, R의 그래픽 표시 버전과 유사합니다
- 추천도: ★★★
11 상호 학습 및 통합 개발
상호 학습 및 통합 개발은 주로 Python 개발, 디버깅 및 통합에 사용되며, Python 통합 개발 환경(IDE)을 포함합니다.
125. IPython/ Jupyter
- 유형: 서드파티 라이브러리
- 설명: IPython은 Python 기반의 대화형 셸로, 기본 Python 셸보다 훨씬 더 유용하며 변수 자동 완성, 자동 들여쓰기, 대화형 도움말, 마법 명령, 시스템 명령 등을 지원합니다. IPython 4.0부터 IPython과 Jupyter 두 분기로 분기되었습니다. 이 분기가 공식적으로 나타나기 전에 IPython은 이미 ipython notebook 기능을 가지고 있었기 때문에, Jupyter는 ipython notebook의 업그레이드 버전과 더 유사합니다
- 추천도: ★★★
126. Elpy
- 유형: 서드파티 라이브러리
- 설명: Elpy는 Emacs용 Python 개발 환경으로, 많은 다른 소프트웨어 패키지를 결합하고 구성하며, 이 패키지들은 모두 Emacs Lisp과 Python으로 작성되었습니다
- 추천도: ★★
127. PTVS
- 유형: 서드파티 라이브러리
- 설명: Visual Studio의 Python 도구
- 추천도: ★★
128. PyCharm
- 유형: 외부 도구
- 설명: PyCharm는 사용자가 Python 언어 개발 시 효율성을 높일 수 있는 전체 도구 세트를 갖추고 있으며, 예를 들어 디버깅, 구문 강조 표시, 프로젝트 관리, 코드 점프, 스마트 제안, 자동 완성, 단위 테스트, 버전 제어 및 IPython, 시스템 터미널 명령줄 등을 통합할 수 있습니다. PyCharm에서는 거의 모든 Python 관련 작업 전체를 구현할 수 있습니다
- 추천도: ★★★
129. LiClipse
- 유형: 외부 도구
- 설명: LiClipse는 Eclipse 기반의 무료 다중 언어 IDE로, PyDev를 통해 Python 개발 응용을 지원합니다
- 추천도: ★★
130. Spyder
- 유형: 외부 도구
- 설명: Spyder는 오픈 소스 Python IDE로, IPython과 다양한 인기 있는 Python 라이브러리의 지원을 받으며 고급 편집, 대화식 테스트, 디버깅 및 숫자 계산 환경을 갖춘 대화형 개발 환경입니다
- 추천도: ★★
12 기타 Python 협력 데이터 작업 도구
기타 Python 협력 데이터 작업 도구는 위 주제 외에 데이터 작업에서 일반적으로 사용되는 다른 도구 또는 라이브러리를 의미합니다.
131. tesseract-ocr
- 유형: 외부 도구
- 설명: 이것은 Google이 지원하는 오픈소스 OCR 이미지 인식 프로젝트로, 200개 이상의 언어(중국어 포함)를 지원하며 사용자 정의 학습 문자 집합을 지원하며 Windows, Linux, Mac OSX 다중 플랫폼 사용을 지원합니다
- 추천도: ★★★
132. RPython
- 유형: 서드파티 라이브러리
- 설명: R 통합 라이브러리
- 추천도: ★★★
133. Rpy2
- 유형: 서드파티 라이브러리
- 설명: Python이 R에 연결하는 라이브러리
134. matpython
- 유형: 서드파티 라이브러리
- 설명: MATLAB 통합 라이브러리
- 추천도: ★★★
135. Lunatic Python
- 유형: 서드파티 라이브러리
- 설명: Lua 통합 라이브러리
- 추천도: ★★
136. PyCall.jl
- 유형: 서드파티 라이브러리
- 설명: Julia 통합 라이브러리
- 추천도: ★★
137. PySpark
- 유형: 서드파티 라이브러리
- 설명: Spark가 제공하는 Python API
- 추천도: ★★★
138. dumbo
- 유형: 서드파티 라이브러리
- 설명: 이 모듈은 Python 사용자가 Hadoop 프로그램을 쉽게 작성하고 실행할 수 있게 해주며, 프로그램 버전이 비교적 이전이므로 참고 자료로 사용할 수 있습니다
- 추천도: ★★
139. dpark
- 유형: 서드파티 라이브러리
- 설명: Python이 Spark의 복제 버전으로, MapReduce 프레임워크와 유사합니다
- 추천도: ★★
140. streamparse
- 유형: 서드파티 라이브러리
- 설명: Streamparse는 Storm을 통해 실시간 데이터 스트림에 Python 코드를 실행할 수 있게 합니다
- 추천도: ★★