'Secondary' 카테고리의 글 목록 (4 Page)

Notice

Recent Posts

Recent Comments

Link

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록Secondary (21)

이동식 저장소

[Github] 브랜치 만들기

저는 Github를 2년 남짓 사용하면서 협업을 해 본 적이 없습니다. 오픈 소스의 성지에서 독방 작업만을 한 셈이죠.. Github을 마치 원격 코드 저장소로만 사용했습니다. 그러다가 어떤 조별과제 때문에 Github의 협업 기능을 본격적으로 이용해야 하는 상황이 되었습니다. 이제 단순히 master에 커밋하고 푸시만 하는 수준으로는 안 된다는 생각이 들어, 본격적으로 협업 기능을 사용해 보려 합니다. 이 글은 Github를 처음 사용하는 초보 개발자를 위한 글이기도 하지만, 동시에 저와 우리 조원들을 위한 글이기도 합니다. 물론 저도 초보 개발자입니다. 브랜치란 무엇인가? 마이크로소프드의 Windows 10도 Github에서 개발되고 있다고 합니다. 수백, 수천 명의 개발자가 동시에 코드를 수정하고 ..

Secondary/Github 2020. 5. 23. 18:31

Data Cleansing

오늘은 새로운 걸 배우는 것보다 생각을 하는 시간이 될 겁니다. 마치 이 블로그 주소처럼 말입니다. 데이터 분석의 첫 번째 과정은 데이터를 얻는 것으로부터 시작됩니다. 물론 우리의 예측 불가능한 세상에서 내가 원하는 대로 데이터를 얻을 수 있다는 보장은 없습니다. 예를 들어 내 방의 온도를 10분 간격으로 측정하는데, 데이터가 한두 개 정도 빠질 수도 있고, 이것이 전혀 이상한 일이 아니라는 것이죠. 물론 이러한 경우 말고도 데이터에 관한 다양한 이슈가 있지만, 어쨌든 raw data 그 자체로 데이터를 분석하기란 참 어렵습니다. 그래서 우리는 데이터를 가공해야 합니다. 데이터 가공에 대한 몇 가지 이슈를 소개하자면 다음과 같습니다. - 특정 데이터의 범위가 매우 커서, y값에 미치는 영향이 다른 변수보..

Secondary/Python 2020. 1. 15. 15:24

matplotlib

matplotlib는 데이터를 시각화하여 보여주는 Python 라이브러리입니다. 다양한 형태의 그래프를 지원하며, Pandas와도 연동되기 때문에 알아두면 좋겠죠? pip install matplotlib matplotlib는 pyplot이라는 객체에 데이터를 쌓은 후, 그래프로 flush하는 방법으로 데이터를 보여줍니다. 이 글에서는 pyplot 대신 plt라는 축약어를 사용하도록 하겠습니다. import import matplotlib.pyplot as plt 선형 그래프 그려보기 가장 간단한 이차함수인 y=x^2를 그려 봅시다. x = range(100) y = [val**2 for val in x] plt.plot(x, y) plt.show() x는 1부터 100까지의 정수, y는 그러한 정수의 ..

Secondary/Python 2020. 1. 12. 21:10

Pandas (2)

오늘은 Pandas를 이용하여 raw data를 여러 형태로 정제하는 법에 대해 알아보겠습니다. import pandas as pd import numpy as np 데이터 준비 ipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings', 'Kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Riders'], 'Rank': [1, 2, 2, 3, 3, 4, 1, 1, 2, 4, 1, 2], 'Year': [2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2017], 'Points': [876, 789, 863, 673, 7..

Secondary/Python 2020. 1. 10. 15:39

Pandas (1)

Pandas는 구조화된 데이터의 처리를 지원하는 Python 라이브러리로, Python계의 엑셀이라고도 불립니다. 엑셀처럼 데이터를 정리하여 보여준다는 뜻이죠. 그럼 이제부터 Pandas를 이용하여 데이터를 읽고 처리하는 방법을 알아보도록 합시다. Import Pandas 역시 외부 라이브러리이므로 import를 해야 사용할 수 있습니다. 이때 pd라는 축약어로 import하는 습관이 널리 퍼져있습니다. import pandas as pd 이 글에서도 pd라는 명칭을 사용하도록 하겠습니다. 데이터 불러오기 데이터는 .csv 파일 또는 웹으로부터 불러올 수 있습니다. 데이터를 불러오기 위해서는 read_csv()를 호출하면 됩니다. data_url = 'https://archive.ics.uci.edu/m..

Secondary/Python 2020. 1. 9. 17:33

이전 Prev 1 2 3 4 5 Next 다음

목록Secondary (21)

이동식 저장소

티스토리툴바