일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Hilt
- textfield
- 백준
- architecture
- Kotlin
- 프로그래머스
- 암호학
- relay
- livedata
- TEST
- Coroutine
- androidStudio
- boj
- Gradle
- Coroutines
- ProGuard
- Compose
- MyVoca
- 코루틴
- pandas
- AWS
- MiTweet
- activity
- 쿠링
- 코드포스
- Rxjava
- Python
- Codeforces
- GitHub
- android
- Today
- Total
목록pandas (3)
이동식 저장소
오늘은 새로운 걸 배우는 것보다 생각을 하는 시간이 될 겁니다. 마치 이 블로그 주소처럼 말입니다. 데이터 분석의 첫 번째 과정은 데이터를 얻는 것으로부터 시작됩니다. 물론 우리의 예측 불가능한 세상에서 내가 원하는 대로 데이터를 얻을 수 있다는 보장은 없습니다. 예를 들어 내 방의 온도를 10분 간격으로 측정하는데, 데이터가 한두 개 정도 빠질 수도 있고, 이것이 전혀 이상한 일이 아니라는 것이죠. 물론 이러한 경우 말고도 데이터에 관한 다양한 이슈가 있지만, 어쨌든 raw data 그 자체로 데이터를 분석하기란 참 어렵습니다. 그래서 우리는 데이터를 가공해야 합니다. 데이터 가공에 대한 몇 가지 이슈를 소개하자면 다음과 같습니다. - 특정 데이터의 범위가 매우 커서, y값에 미치는 영향이 다른 변수보..
오늘은 Pandas를 이용하여 raw data를 여러 형태로 정제하는 법에 대해 알아보겠습니다. import pandas as pd import numpy as np 데이터 준비 ipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings', 'Kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Riders'], 'Rank': [1, 2, 2, 3, 3, 4, 1, 1, 2, 4, 1, 2], 'Year': [2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2017], 'Points': [876, 789, 863, 673, 7..
Pandas는 구조화된 데이터의 처리를 지원하는 Python 라이브러리로, Python계의 엑셀이라고도 불립니다. 엑셀처럼 데이터를 정리하여 보여준다는 뜻이죠. 그럼 이제부터 Pandas를 이용하여 데이터를 읽고 처리하는 방법을 알아보도록 합시다. Import Pandas 역시 외부 라이브러리이므로 import를 해야 사용할 수 있습니다. 이때 pd라는 축약어로 import하는 습관이 널리 퍼져있습니다. import pandas as pd 이 글에서도 pd라는 명칭을 사용하도록 하겠습니다. 데이터 불러오기 데이터는 .csv 파일 또는 웹으로부터 불러올 수 있습니다. 데이터를 불러오기 위해서는 read_csv()를 호출하면 됩니다. data_url = 'https://archive.ics.uci.edu/m..