-
[python] [pandas] 특정 칼럼 기준으로 값이 개수 구해서 새로운 칼럼에 추가하기 ( = 엑셀의 countif 함수)Data miner/Development log 2021. 1. 20. 16:31728x90
# 적용 전 Color Value Red 100 Red 150 Blue 50 NaN 30 # 적용 후 Color Value Counts Red 100 2 Red 150 2 Blue 50 1 NaN 30 0
Color열 기준으로 같은 값을 가지는 개수를 Counts 열로 추가하고자 한다면, 다음의 코드를 사용한다.
df['Counts'] = df.groupby(['Color'])['Value'].transform('count')
다만, 컬럼의 값이 Null(Nan) 비어 있는 경우, 비어 있는 값의 개수들을 따로 카운팅하지 않는다. 이에, NaN 인 컬럼의 값들은 Counts 열에서 0의 값을 가진다.
'Data miner > Development log' 카테고리의 다른 글
[Spark] 아파치 스파크 개념 정리중 (1) 2021.02.17 [python] [pandas] 특정 칼럼에 속한 unique한 값의 개수 구하기 (0) 2021.01.22 [tf.Keras] Keras.models의 Model과 keras.layers의 Lambda (0) 2021.01.15 Data Augmentation (0) 2021.01.07 [python] [pandas] encoding='cp949'로 저장하는데 에러 발생 문제 (0) 2020.10.15