STUDY 30

Git 공부하기(2)

코딩애플 (매우쉽게 알려주는 git&github 영상 1.git 에서 branch 만들기 *bradnch: 프로젝트 복사본, 커밋의 복사 1)branch 만들기 git branch 브랜치이름 : 사본 생성 git switch coupon : 방금 만든 coupon 브랜치로 이동 git switch master : 메인 브랜치로 이동 2)merge 각각의 브랜치에서 만들었던 내용을 합치는 것. but 각각의 브랜치에서 같은 내용을 수정할 경우 충돌발생! 브랜치 합치기는 main/master 브랜치로 이동한 뒤에 git merge 브랜치명/ 나는 git pull 브랜치 브랜치마다 commit 내역을 그래프로 보고싶으면 git log --graph --oneline --all 브랜치 합칠 때 conflict가..

STUDY 2023.03.21

Git 공부하기(1)

2차프로젝트를 할때 파일 공유를 위해 github를 사용하기로 했다. 그래서 코딩애플의 (매우쉽게 알려주는 git&github 영상을 보았다(무료)) https://codingapple.com/course-status/ 나는 8강까지 우선 수강하였고, 팀플끝나고 마저 완강할 예정이다. 1.git허브 설치 및 vscode설치(윈도우 기준) 1)git 허브 설치 https://git-scm.com/download/win 깃허브 설치하기. 나는 64-bit Git for Windows Setup.을 다운받음 원하는 폴더 만들어서 (git을 사용할 예정) shift+우클릭=>파워쉘 창열어서 아래 내용 타이핑하기 2)vscode설치 https://code.visualstudio.com/download 나는 x64..

STUDY 2023.03.21

Python[빅데이터] 데이터 크롤링(3)

(2) Selenium 1. daum 페이지에서 이미지들 다운받아 저장하기 from selenium import webdriver import time #...(1) import urllib.request as req import os driver = webdriver.Chrome("temp/chromedriver") driver.get("https://search.daum.net/search?w=img&nil_search=btn&DA=NTB&enc=utf8&q=%EC%9E%A5%EB%AF%B8") time.sleep(3) (1) time 모듈은 시간과 관련된 함수들을 제공 time.sleep() 함수를 사용하여 코드 실행을 일정 시간 동안 중지 time.time() 함수를 사용하여 현재 시간을 초 단위..

STUDY/Python 2023.03.07

JAVA_연산자(Operations)

연산자(Operations) -연산에 사용되는 표시나 기호(+, -, *, /, %, =, ...) 1.산술(나머지):System.out.println(10%8);#2 2.부호:int x=-10; System.out.println("+x="+ +x); //+x=-10 4,5.증감+대입: y=x++; //1)=x: 대입연산자, 2)x++ 증감연산자 System.out.println("1.x="+x+",y="+y); //x=6, y=5 7.논리: System.out.println("!false="+!false); //!false=true 8.조건: result = (60 %2==1) ? "홀수" : (score > 0) ? "짝수" : "0"; System.out.println(result +"입니다.");..

STUDY/JAVA 2023.03.06

JAVA_변수(valuable)

*자바 Eclipse IDE 22.06 ver로 연습하였습니다. *기본안내 1)varEx1.java 파일이 class varEx1 클래스 명과 동일해야한다. 2)main이 실행 메소드. 다른 메소드가 많아도 메인에서 실행된다. 3)syso+ctl+spac 자동완성된다. *변수란? 값을 저장할 수 있는 메모리상의 공간을 의미한다. 변수의 값은 바뀔 수 있으며, 하나의 변수에는 단 하나의 값만을 저장할 수있다. 그래서 값을 여러 번 저장하면 마지막에 저장한 값을 갖게 된다 (1) 변수의 선언 : 변수타입 변수이름; int number; (2)변수의 초기화 -지역변수는 사용되기 전에 초기화를 반드시 해야 한다 -클래스변수와 인스턴스변수는 초기화를 생략할 수 있다. 1. 자료형 기본형: 논리형: boolean(..

STUDY/JAVA 2023.03.06

Python[빅데이터] 데이터 크롤링(2)

(2) Selenium 웹 브라우저 자동화 도구. 웹 브라우저를 제어하고 웹 페이지를 스크래핑하거나 웹 애플리케이션을 자동화 할 수 있다. Selenium은 동적인 웹 페이지에서 데이터를 추출하거나 웹 애플리케이션을 테스트하기에 적합합니다. 🔧선작업 1.크롬브라우저 버전 확인하기(도움말 -> 크롬정보) 2. http://chromedriver.chromium.org/downloads => 내 크롬정보와 동일한크롬드라이버 다운받기. chromdriver_win32.zip 3.압축풀기 4.chromdriver.exe의 위치정하기: C:\\Users\\User\\pyworkspace\\temp 5.pip install selenium 라고 anaconda prompt에 등록하기 from selenium imp..

STUDY/Python 2023.03.06

Python[빅데이터] 데이터 크롤링(1)

👆크롤링: 웹페이지(xml)을 긁어서 자료를 만드는 것 빅데이터 종류 1. 정형데이터 : csv, excel, db table 2. 반정형데이터 : html, xml, json,... ✨크롤링✨, BeautifulSoup, Selenium 모듈 3. 비정형데이터 : 이미지,동영상,... 1) BeautifulSoup: 파이썬에서 가장 많이 사용되는 HTML 및 XML 구문 분석(정적인 웹 페이지추천) 라이브러리 1. 외부에서 데이터 긁어서 읽어보기 from bs4 import BeautifulSoup #BeautifulSoup = htmp, xml 파싱 모듈 import urllib.request as req url="

STUDY/Python 2023.03.06

Python[빅데이터] 데이터 전처리(3)

데이터 연계/통합 두개의 DataFrame 연결하기 1. concat(): 물리적 두개의 데이터를 연결(그냥 위아래로 붙임) result2=pd.concat([df1,df2], axis=0) 2. merge: 컬럼을 기준으로 컬럼값이 같은 값인 경우 레코드를 병합.(sql문장의 inner join과 같은 의미) #조인컬럼: id의 값이 같을 때 이름이 같은건 조인하고 아닌건 안나타남 result3=pd.merge(df1, df2) #or result3=pd.merge(df1,df2,on="id") result3.info() #df1.id == df2.id 것이 5개임 3. outer merge 1) how="left" : 왼쪽 데이터는 조인되는 값이 없어도 선택(출력됨) => left outer join..

STUDY/Python 2023.03.06

Python[빅데이터] 데이터 전처리(2)

#데이터 전처리 : 원본데이터를 원하는 형태로 변경하는 과정 1. 결측값 처리 : 값이 없는 경우. ❤️2. 중복데이터 처리 ❤️3. 오류데이터 존재.(결측값과 목표는 같지만 목적이 조금 다름) 2. 중복데이터 처리 - duplicated() : 중복데이터 찾기. 첫번째 데이터는 False,같은 데이터인 경우 두번째 True - drop_duplicates() : 중복데이터를 제거. 중복된 데이터 중 한개는 남김. df = pd.DataFrame({"c1":['a','a','b','a','b'], "c2":[1,1,1,2,2], "c3":[1,1,2,2,2]}) df_dup = df.duplicated() df_dup #0 False / 1 True / 2 False/ 3 False/ 4 False co..

STUDY/Python 2023.03.06

Python[빅데이터] 데이터 전처리(1)

#데이터 전처리 : 원본데이터를 원하는 형태로 변경하는 과정 ❤️1. 결측값 처리 : 값이 없는 경우. 2. 중복데이터 처리 3. 오류데이터 존재.(결측값과 목표는 같지만 목적이 조금 다름) 1. 결측값 처리 : 값이 없는 경우. 1.결측값 확인 import seaborn as sns import pandas as pd df=sns.load_dataset("titanic") df.info() #11 deck 203 non-null category (전체 891개의 non-null값이 존재함) df.deck.unique() #Categories (7, object): ['A', 'B', 'C', 'D', 'E', 'F', 'G'] + NULL값 df.deck.value_counts() #결측값 제외한 값의..

STUDY/Python 2023.02.24