what is black? 공식 도큐먼트 : https://black.readthedocs.io/en/stable/ 파이썬 코드 자동 포맷팅 도구이다. flake8이 단순히 "이거 틀렸어요!"라고 가르쳐 준다면, 이 툴은 알아서 포맷팅을 진행한다. 일종의 협업툴이라 볼 수 있다. install $ pip install black use this in vim black .pyblack $PWD # 현재 폴더 하위의 모든 파이썬 파일에 재귀적으로 black 포맷팅을 적용 use this in pycharm plugin file watcher 다운받기 Preference -> Plugins 에서 FileWatcher를 다운받는다. black 이 설치된 위치 확인 $ which black 결과 : usr/loc..
보호되어 있는 글입니다.
이 장에서는 스파크에서 사용가능한 여러 유형의 집계 연산에 대해 알아보았다. 그룹화, 윈도우함수, 롤업, 큐브도 알아보았다. 집계 연산¶집계(aggregation)은 빅데이터 분석의 초석입니다. 집계를 수행하려면 key와 group을 지정하고, 하나 이상의 칼럼을 변환하는 방법을 지정하는 집계함수를 사용합니다. Spark는 모든 데이터 타입을 다루는 것 외에도 다음과 같은 그룹화 데이터 타입을 생성할 수 있습니다. 가장 간단한 형태의 그룹화는 select 구문에서 집계를 수행해 DataFrame의 전체 데이터를 요약한다. group by는 하나 이상의 키를 지정할 수 있고, 값을 가진 컬럼을 변환하기 위해 다른 집계함수를 사용할 수 있다. 윈도우(window)는 하나이상의 키를 지정할 수 있고, 값을 가..
다양한 데이터 타입 다루기¶이 장에서는 스파크의 구조적 연산에서 가장 중요한 내용인 표현식을 만들고, 다양한 데이터 타입을 다루는 방법에 대해 알아봅시다. 불리언 타입 수치 타입 문자열 타입 date와 timestamp 타입 null값 다루기 복합 데이터 타입 사용자 정의 함수 API는 어디서 찾을끼?¶나중에 버전이 바뀌고 바뀌어도, Spark의 데이터 변환용 함수를 찾기 위해 핵심적으로 다뤄야할 부분은 다음과 같습니다. DataFrame(Dataset) 메서드 Column Method In [77]: df = spark.read.format("csv").option("header", "true").option("inferSchema", "true").load("./data/retail-data/by-d..
구조적 API 기본 연산¶DataFrame은 Row 타입의 레코드(Record)와 각 레코드에 수행할 연산 표현식을 나타내는 여러 컬럼(Column)으로 구성됩니다. 스키마(Schema)는 각 컬럼명과 데이터타입을 정의합니다. DataFrame의 파티셔닝(Partitioning)은 DataFrame이나 Dataset이 클러스터에서 물리적으로 배치되는 형태를 정의합니다. 파티셔닝 스키마(Partitioning Schema)는 파티션을 배치하는 방법을 정의합니다. 파티셔닝의 분할 기준은 특정 컬럼이나 비결정론적인 값을 기반으로 설정할 수 있습니다. 우선 DataFrame을 생성합니다. In [4]: df = spark.read.format("json").load("./data/flight-data/json/..
- Total
- Today
- Yesterday
- 마크다운
- 디비
- 주피터노트북 설치
- EC2
- 파이참
- hot
- 자바인강
- 쉘스크립트
- 자바 인강
- https://cupjoo.tistory.com/96
- 유용한웹사이트
- pycharm
- 패스트 캠퍼스
- 참고 링크
- CKA
- linter
- 스프링 프레임워크 핵심 기술
- vim
- 배포
- 세션불일치
- 쿠버네티스
- 크론탭
- AWS
- 자바
- 패스트캠퍼스
- 자바 인강이 듣고 싶다면 => https://bit.ly/3ilMbIO
- 언제나 함께해요
- 자스계의백과사전
- django
- 환경세팅
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |