TIL
  • Main
  • TIL : ML
    • AI News
      • AI-powered coding, free of charge with Colab
    • Paper
      • Retrieval-augmented generation for knowledge-intensive nlp tasks
        • reference 정리
      • Sequence to Sequence
    • Generative AI
      • LLM
        • 기본 개념
    • Boostcamp
      • Daily Report
        • 2021
          • 09
            • week4
            • week5
          • 10
            • week1
            • week2
            • week3
            • week4
          • 11
            • week1
            • week2
            • week3
            • week4
            • week5
          • 12
            • week1
            • week2
            • week3
      • Final Project
        • 프로젝트 기획
          • 🌟최종 프로젝트 기획
          • 최종 프로젝트 Version
          • 아이디어 수집
          • 욕설, 혐오발언 감지
          • 라이브 커머스 레포팅 프로젝트
        • 프로젝트 진행
          • week1
          • week2
          • week3
      • Competition
        • 1. [NLP] 문장 내 개체간 관계 추출
          • Day1 (9.27, 월)
          • Day2-3 (9.28~29, 화~수)
          • Day4 (9.30, 목)
          • Day5 (10.1, 금)
          • Day6~7 (10.2~3, 토~일)
          • Day8 (10.4, 월)
          • Day9 (10.5, 화)
          • Day10 (10.6, 수)
          • Day 11 (10.7 목)
        • 2. [NLP] MRC 프로젝트
          • Day1 (10.25, 월)
          • Day2 (10.26, 화)
          • Day3 (10.27, 수)
          • Day4-5 (10.28-29, 목-금)
          • Day6 (11.1, 월)
          • Day7 (11.2, 화)
          • Day8 (11.3, 수)
          • Day9 (11.4, 목)
        • 🔨3. [NLP] 데이터 제작
          • Day1
        • 🔨4. [공통] 모델 경량화
      • [U Stage] - DL basic
        • (01강) 딥러닝 기본 용어 설명 - Historical Review
        • (02강) 뉴럴 네트워크 - MLP (Multi-Layer Perceptron)
        • (03강) Optimization
        • 🔨(04강) Convolution은 무엇인가?
        • 🔨(05강) Modern CNN - 1x1 convolution의 중요성
        • 🔨(06강) Computer Vision Applications
        • (07강) Sequential Models - RNN
        • (08강) Sequential Models - Transformer
        • Page 2
      • [U Stage] - PyTorch
        • (01강) Introduction to PyTorch
        • (02강) PyTorch Basics
        • (03강) PyTorch 프로젝트 구조 이해하기
        • (04강) AutoGrad & Optimizer
        • (05강) Dataset & Dataloader
        • (06강) 모델 불러오기
        • (07강) Monitoring tools for PyTorch
        • (08강) Multi-GPU 학습
        • (09강) Hyperparameter Tuning
        • (10강) PyTorch Troubleshooting
      • [U Stage] - NLP
        • (01강) Introduction to NLP, Bag-of-Words
        • (02강) Word Embedding
        • (03강) Recurrent Neural Network and Language Modeling
        • (04강) LSTM and GRU
        • (05강) Sequence to Sequence with Attention
        • (06강) Beam Search and BLEU score
        • (07-08강) Transformer
        • (09강) Self-supervised Pre-training Models
      • [P Stage] - KLUE
        • (1강) 인공지능과 자연어 처리
        • (2강) 자연어의 전처리
        • (3강) BERT 언어모델 소개
        • (4강) 한국어 BERT 언어 모델 학습
        • (5강) BERT 기반 단일 문장 분류 모델 학습
        • (6강) BERT 기반 두 문장 관계 분류 모델 학습
        • (7강) BERT 언어모델 기반의 문장 토큰 분류
        • 오피스아워 (9.30, 목)
        • (8강) GPT 언어 모델
        • (9강) GPT 언어모델 기반의 자연어 생성
        • (10강) 최신 자연어처리 연구
      • [P Stage] - MRC
        • Before Study
        • (1강) MRC Intro & Python Basics
        • (2강) Extraction-based MRC
        • (3강) Generation-based MRC
        • (4강) Passage Retrieval - Sparse Embedding
        • (5강) Passage Retrieval - Dense Embedding
        • 오피스아워
        • (6강) Scaling up with FAISS
        • (7강) Linking MRC and Retrieval
        • (8강) Reducing Training Bias
        • (9강) Closed-book QA with T5
        • (10강) QA with Phrase Retrieval
        • 마스터클래스
      • [P Stage] - 데이터제작(NLP)
        • (1강) 데이터 제작의 A to Z
        • (2강) 자연어처리 데이터 기초
        • (3강) 자연어처리 데이터 소개 1
        • (4강) 자연어처리 데이터 소개 2
        • (5강) 원시 데이터의 수집과 가공
        • 오피스아워 (11.10, 수)
        • (6강) 데이터 구축 작업 설계
        • (7강) 데이터 구축 가이드라인 작성 기초
        • (8강) 관계 추출 과제의 이해
        • (9강) 관계 추출 관련 논문 읽기
        • (10강) 관계 추출 데이터 구축 실습
      • [P Stage] - 모델 최적화
        • (1강) 최적화 소개 및 강의 개요
        • (2강) 대회 및 데이터셋 소개
        • (3강) 작은 모델, 좋은 파라미터 찾기: AutoML 이론
        • 🔨(4강) 작은 모델, 좋은 파라미터 찾기: AutoML 실습
        • (5강) 작은 모델, 좋은 파라미터 찾기: Data Augmentation & AutoML 결과 분석
        • 🔨오피스아워 -Baseline 코드에 모듈 작성하기(신종선 멘토님)
      • [P Stage] - Product Serving
        • Part 1: Product Serving 개론
          • 1.1 강의 진행 방식
          • 1.2 MLOps 개론
          • 1.3 Model Serving
          • 1.4 머신러닝 프로젝트 라이프 사이클
        • Part 2: 프로토타입부터 점진적으로 개선하기
          • 2.1 프로토타이핑 - Notebook 베이스(Voila)
          • 2.2 프로토타이핑 - 웹 서비스 형태(Streamlit)
          • 2.3 Linux & Shell Command
          • 2.4 Cloud
          • 2.5 Github Action을 활용한 CI/CD
        • Part 3: 더 완성화된 제품으로
          • 3.1.1 FastAPI
          • 3.1.2 Fast API
          • 3.1.3 Fast API
          • 3.2 Docker
          • 3.3 Logging
          • 3.4 MLFlow
        • Part 4: 심화 소재
          • 4.1 BentoML
          • 4.2 Airflow
          • 4.3 머신러닝 디자인 패턴
          • 4.4 앞으로 더 공부하면 좋을 내용
      • 특강
        • (특강) 김상훈 - 캐글 그랜드마스터의 노하우 대방출
        • (특강) 이활석 - 서비스 향 AI 모델 개발하기
        • (특강) 구종만 - AI + ML과 Quant Trading
        • (특강) 문지형 - 내가 만든 AI 모델은 합법일까, 불법일까
        • (특강) 이준엽 - Full Stack ML Engineer
        • (특강) 박은정 - AI 시대의 커리어 빌딩
        • (특강) 오혜연 - AI Ethics
    • Competition
      • (DACON)한국어 문장 관계 분류 경진대회
        • Day1(2.14, 월)
        • Day2(2.15, 화)
        • Day3(2.16, 수)
        • Day4(2.17, 목)
      • 2021 인공지능 데이터 활용 경진대회
        • 역량평가
          • Day1 (9.28, 화)
          • Day2 (9.29, 수)
          • Day3 (9.30, 목)
        • 예선
          • Data 분석
          • NSML
          • What We Have Done?
    • ETC
      • 인터뷰 대비
        • Computer Science
        • ML/DL
      • Poetry로 dependency 관리
        • window에서 설치하기
      • code block
      • 공부할 것 임시보관
      • Transformer to T5
      • Hugging Face Tutorial
        • Ch1. Transformer models
        • Ch2. Using Transformers
        • Ch3. Fine-tuning a model with the Trainer API
      • KLUE
      • Pandas
  • TIL : Ops
    • AWS
      • SageMaker
  • TIL : Computer (CS)
    • Error
      • TextEncodeInput must be Union[TextInputSequence, Tuple[InputSequence, InputSequence]]
    • Algorithm
      • Theory
      • Programmers
        • 기능개발
    • ETC
      • Github 커밋 히스토리 삭제
Powered by GitBook
On this page

Was this helpful?

  1. TIL : ML
  2. Boostcamp
  3. 특강

(특강) 문지형 - 내가 만든 AI 모델은 합법일까, 불법일까

데이터를 수집하기 위해 웹 크롤링이나 누군가가 업로드한 데이터 셋을 다운로드 받기 마련이다. 수많은 데이터를 직접 만들 수는 없기에... 하지만 이런 데이터들을 아무 생각없이 사용하게 되면 저작권법에 위배 될 수 있으니 저작권에 위배되지 않고 데이터를 수집하기 위한 방법에 대한 특강이다.

저작권이란? 사람의 생각이나 감정을 표현한 결과물(저작물)에 대하여 창작자에게 주는 권리로 "창작성"이 있다면 별도의 등록절차 없이 자연히 발생한다.

(예시)

  1. 소설ㆍ시ㆍ논문ㆍ강연ㆍ연설ㆍ각본 그 밖의 어문저작물

  2. 음악저작물

  3. 연극 및 무용ㆍ무언극 그 밖의 연극저작물

  4. 회화ㆍ서예ㆍ조각ㆍ판화ㆍ공예ㆍ응용미술저작물 그 밖의 미술저작물

  5. 건축물ㆍ건축을 위한 모형 및 설계도서 그 밖의 건축저작물

  6. 사진저작물(이와 유사한 방법으로 제작된 것을 포함한다)

  7. 영상저작물

  8. 지도ㆍ도표ㆍ설계도ㆍ약도ㆍ모형 그 밖의 도형저작물

  9. 컴퓨터프로그램저작물

반면 저작권법에 보호받지 못해 상업적 사용이 가능한 저작물도 있다.

  1. 헌법ㆍ법률ㆍ조약ㆍ명령ㆍ조례 및 규칙

  2. 국가 또는 지방자치단체의 고시ㆍ공고ㆍ훈령 그 밖에 이와 유사한 것

  3. 법원의 판결ㆍ결정ㆍ명령 및 심판이나 행정심판절차 그 밖에 이와 유사한 절차에 의한 의결ㆍ결정 등

  4. 국가 또는 지방자치단체가 작성한 것으로서 제1호 내지 제3호에 규정된 것의 편집물 또는 번역물

  5. 사실의 전달에 불과한 시사보도

합법적으로 데이터를 사용하기 위해 다음과 같은 방법이 있다.

1. 저작자와 협의한다.

계약서를 통해 저작물 이용을 허락, 양수 받는 등의 방법이 있다.

  • 독점적 이용허락의 경우, 저작자는 계약을 체결한 이용자에게 데이터 이용에 대한 “독점적” 인 권리를 행사하는 것을 허락하는 것이다

    • 예: 만약 A사가 보유한 데이터에 대해 B사와 저작재산권 독점적 이용허락계약을 맺었다면 A사는

      C사와 같은 계약을 체결할 수 없다 (계약위반 책임을 지는 것을 감수한다면 가능하다)

  • 비독점적 이용허락의 경우, 저작자는 계약을 체결한 이용자 외에도 데이터 이용 계약을 맺을

    수 있다

    • 예: 만약 A사가 보유한 데이터에 대해 B사와 저작재산권 비독점적 이용허락계약을 맺었다면

      A사는 C사와 같은 계약을 체결할 수 있다

2. 라이센스

  • 저작자에게 이용 허가 요청을 하지 않아도 저작자가 제안한 특정 조건을 만족하면 이용이

    가능하도록 만든 저작물에 대한 이용허락 규약

  • 라이센스를 발행하는 단체는 다양할 수 있다

    • 가장 유명한 것은 Creative Commons 라는 비영리 단체에서 제공하는 CCL이 있습니다

    • 국내에는 문화체육관광부에서 제공하는 공공누리가 있습니다

그 외에도 뉴스데이터의 경우 저작권은 언론사에 있으며, 사용을 희망할 경우 한국언론진흥재단에 문의 혹은 직접 언론사에 컨텐츠 사용 범위와 계약 조건에 대해 문의가 필요하다.

혹, 0원에 구매한 데이터의 경우에도 판매자의 조건에 따라 사용여부가 달라질 수 있으니, 유의할 것.

단, 뉴스 기사의 제목은 저작물로서 가치를 인정받지 못해 저작권법의 보호를 받지 않는다.

공정 이용 (Fair-use)

  • 아래와 같은 경우에 대해서는 저작권자의 허락없이 사용이 가능하다.

단순히 데이터를 어디서 가져오는 것에만 생각했지, 가져와도 되는지에 대해 이렇게 생각해본적이 없었던 것 같다. 실제로 P-Stage 이미지 분류 때에 마스크 이미지를 추가적으로 사용하려 했으나, 상업적 사용이 허가된 데이터 셋을 찾지 못했던 경험이 있다. 추후에 어디서 유효한 데이터를 합법적으로 가져올 수 있는지에 대한 고려가 필요할 것 같다.

Previous(특강) 구종만 - AI + ML과 Quant TradingNext(특강) 이준엽 - Full Stack ML Engineer

Last updated 3 years ago

Was this helpful?