인터넷 기본 지식

#1. 인터넷은 어떻게 동작하는가?

흰제비갈매기 2024. 5. 30. 20:34

네트워크

두 개의 컴퓨터가 통신을 한다면? 유선 연결(이더넷 케이블)을 하거나 무선(WIFI, Bluetooth)으로 연결해야 한다.
(아래의 경우 전부 유선으로 가정)
만일 두 대의 컴퓨터라면 1개의 케이블, 세 대의 컴퓨터라면 3개, ... 만일 10대라면 45개의 케이블이 필요하다.
이러는 큰 단점으로 다가오는데 이를 극복하고자 라우터라는 소형 컴퓨터에 모든 컴퓨터를 연결하였다.

라우터(Router): 
    디바이스가 인터넷 또는 인트라넷을 통해 연결하여 데이터를 공유할 수 있게 해준다. 
    한 개 이상의 근거리 통신망(LAN) 간에 데이터를 전달하는 게이트웨이이다. 
    라우터는 인터넷 프로토콜(IP)을 사용하여 데이터가 포함된 IP패킷을 전송하며,
    분리된 각각의 근거리 통신망(LAN)에 위치한 원본 및 대상 디바이스의 IP주소를 사용한다. 
    라우터는 송신 디바이스와 수신 디바이스가 연결되는 이러한 LAN 사이에 위치한다.

인트라넷(Intranet):
    특정 조직에서만 사용 가능한 '사내망'으로 조직 내부에서만 접속이 가능하다.

게이트웨이(Gateway):
    컴퓨터 네트워크에서 서로 다른 통신망, 프로토콜을 사용하는 네트워크 간의 통신을 
    가능하게 하는 컴퓨터나 소프트웨어를 두루 일컫는 용어,
    즉 다른 네트워크로 들어가는 관문 역할을 하는 네트워크 포인트이다. 
    종류가 다른 네트워크 간의 통로의 역할을 하는 장치. 

트래픽(Traffic):
    서버의 데이터 전송량을 의미한다. 외부에서 해당 서버에 접속을 많이 시도할 수록 트래픽이 증가한다.
    트래픽이 서버가 버틸 수 있는 한계를 넘어서 지속적으로 들어올 경우, 서버는 버티지 못하고 다운되어 버린다.
    이 점을 이용하여 상대방 서버를 마비시키는 것을 서비스 거부 공격(DoS)라고 한다.

패킷(Packet):
    (네트워크)패킷은 네트워크를 통해 전송되는 형식화된 데이터 덩어리다.
    네트워크 패킷의 주요 컴포넌트는 사용자 데이터와 제어 정보이다.
    사용자 데이터는 'payload'로 알려져 있고, 제어정보는 payload를 전달하기 위한 정보이다.

라우터는 조율자 역할을 한다. 예를 들어 A컴퓨터가 B컴퓨터로 메시지를 보내고자 한다. 그렇다면 A컴퓨터는 라우터에게 메시지를 보내고 라우터는 정확하게 B컴퓨터에 메시지를 전달해준다. 라우터 또한 컴퓨터이기에 라우터와 라우터를 연결할 수 있다. 그렇게 된다면, 컴퓨터를 무한히 확장할 수 있다.
허나 이또한 제약이 있다. 만일 먼 거리에 있는 사람에게 메시지를 보내고자한다면, 매우 많은 라우터, 케이블이 필요할 것이다. 그렇기에 이를 극복하고자 이미 설치되어 있는 전화기의 케이블을 활용한다. 이미 전화기의 기반 인프라는 모든 곳에 연결되어있기에 활용하기 좋은 요소이다. **모뎀**이라는 장비를 통해, 네트워크의 정보를 전화 시설에서 처리 할 수 있는 정보로 바꾸어 사용할 수 있게 한다. 이렇게 네트워크들은 전화 시설에 연결된다.
모뎀(MOdulator and DEModulator, MODEM):
    컴퓨터, 스마트폰, 태블릿 및 기타 장치를 인터넷에 연결할 수 있게 해주는 장치다.  

이렇게 연결된 네트워크를 우리가 사용하고자한다면, 네트워크를 인터넷 서비스 제공업체(Internet Service Provider, ISP) 에 연결해야한다. ISP는 서로 연결되어 있는 몇몇 특수한 라우터를 관리하고 심지어 다른 ISP의 라우터에도 액세스 할 수 있는 회사이다. 이를 통해 사용자의 네트워크의 메시지는 ISP의 네트워크를 통해 목적지 네트워크로 전달된다.

ISP(Internet Service Provider): 
    인터넷에 접속하는 수단을 제공하는 주체를 가리키는 말. 
    이들은 곳곳에 인터넷 케이블들을 깔아두고, 우리는 돈을 주고 이 케이블을 사용하는 것이다.
    흔히 sk, lg, kt가 있다.  
    인터넷은 이러한 전체 네트워크 인프라로 구성된다.  

컴퓨터 찾기

특정 컴퓨터에 메시지를 보내고자 한다면 특정 메시지를 지정할 수 있어야 한다. 네트워크에 연결된 모든 컴퓨터에는 **IP주소**라는 고유한 주소가 있다. 주소는 점으로 구분 된 네 개의 숫자로 구성된 주소이다. (e.g. 192.168.0.2)
컴퓨터는 이러한 주소로 다른 컴퓨터를 찾아가는데 문제가 없지만, 사용자 입장에서 IP주소를 기억하기는 어렵다. 그렇기에 '도메인 이름' 을 부여하여 사람이 읽을 수 있는 IP주소의 이름을 지정할 수 있다. (e.g. 173.194.121.32는 google.com)

인터넷과 웹 웹 브라우저에서 도메인 이름을 사용하여 웹 사이트에 접속한다. 허나 이는 '인터넷 = 웹'을 의미하는 것이 아니다.
정확하게는 몇억 대의 컴퓨터를 연결하는 인프라인 인터넷에서, '웹 서버' 서비스를 제공하는 것이다. 이밖에 'email', 'IRC(internet Relay Chat)'의 서비스가 있다.

클라이언트와 서버 웹에 연결된 컴퓨터는 클라이언트서버라고 한다.

  • 클라이언트는 일반적인 웹 사용자의 인터넷이 연결된 장치들과 이런 장치들에서 이용가능한 웹에
    접근하는 소프트웨어(e.g. chrome)이다.
  • 서버는 웹페이지, 사이트, 또는 앱을 저장하는 컴퓨터이다.
    클라이언트의 장비가 웹페이지에 접근하길 원할 때, 서버로부터 클라이언트의 장치로 사용자의
    웹 브라우저에서 보여지기 위한 웹페이지의 사본이 다운로드 된다.

웹 주소를 입력할 때

  1. 브라우저는 DNS 서버로 가서 웹사이트가 있는 서버의 진짜 주소를 찾는다.
  2. 브라우저는 서버에게 웹사이트의 사본을 클라이언트에게 보내달라는 HTTP 요청 메세지를 서버로 전송한다. 이 메세지, 그리고 클라이언트와 서버 사이에 전송된 모든 데이터는 TCP/IP 연결을 통해서 전송된다.
  3. 이 메세지를 받은 서버는 클라이언트의 요청을 승인하고, "200"의 HTTP 상태코드를 클라이언트에게 전송한다. 그 다음 서버는 웹사이트의 파일들을 데이터 패킷이라 불리는 작은 일련의 덩어리들로 브라우저에 존상하기 시작한다.
  4. 브라우저는 이 작은 덩어리들을 합쳐 웹 사이트를 보여준다.
TCP/IP:
    Transmission Control Protocol(전송 제어 규약)과 Internet Protocol(인터넷 규약)은 
    컴퓨터와 컴퓨터간의 지역네트워크(LAN)과 광역네트워크(WAN)에서 원활한 통신을 가능하도록 하기위한 통신 규악이다.
    TCP/IP는 하드웨어, 운영체제, 접속매체에 관계없이 동작할 수 있다는 개방성 때문에 선택되었다.
    이름 그대로 2개의 프로토콜이 이루어져 있다. IP기반에 TCP가 사용된다.
    즉 IP프로토콜위에 TCP 프로토콜이 놓이는 것이다. 주방과 손님을 이어주는 홀서버와 비슷하다.

IP:
    네트워크 상에서 컴퓨터는 고유한 주소가 있다. 컴퓨터의 주소는 인터넷에 접속할 때 컴퓨터 각각에 부여받는다.
    이 주소는 총 4바이트로 이루어져 있다.


TCP:
    클라이언트와 서버간에 데이터를 신뢰성 있게 전달하기 위해 만들어진 프로토콜이다. 
    TCP는 근거리 통신망(LAN), 원거리 통신망(WAN), 인트라넷, 인터넷 등 컴퓨터에서 실행되는
    프로그램 간에 일련의 데이터를 안정적으로 순서대로 에러없이 데이터를 교환할 수 있게 한다.

DNS(Domain Name system Server):
    웹사이트를 위한 주소록과 같다. 사용자가 웹 도메인명을 입력할 때,
    브라우저는 DNS에서 도메인명을 검색하고 웹 IP주소를 알아낸다. 그 다음 IP 주소를 브라우저에 전달한다.

HTTP(HyperText Transfer Protocol):
    클라이언트와 서버가 서로 통신할 수 있게 하기 위한 언어를 정의하는 어플리케이션 규약이다.
    손님과 주방과 홀서버의 언어를 통일시키는 것과 비슷하다.

컴포넌트 파일:
    코드 파일: HTML, CSS, JAVASCRIPT따위의 언어
    자원: 이미지, 음악, 비디오, 단어, PDF 따위의 자원들

HTTP 상태코드:
    특정 HTTP 요청이 성공적으로 완료되었는지 알려준다. 응답은 5개의 그룹으로 나뉘는데,
    정보를 제공하는 응답, 리다이렉트, 클라이언트 에러, 그리고 서버 에러가 있다.

패킷과 프로토콜

자원을 전송할 때는 패킷(packet) 단위로 나눈 데이터 조각이 오간다. 이러한 패킷들은 전자 신호로 변환되어 이더넷 케이블 이라는 전선을 먼저 통과해야 한다. 전자 신호는 0과 1로 이루어져 있고, 이 신호를 아무런 양식없이 전송한다면 이것이 텍스트인지, 이미지인지 구분할 수 없다. 그렇기에 특정 양식, 즉 통신 규약을 정해놓았는데, 이를 프로토콜이라고 한다. 대표적으로 TCP/IP 4 Layer이라고 한다. 이는 프로토콜을 각 역할로 구분하여 계층을 나눠놓은 것이다.

  • L4 - 응용계층 (HTTP, FTP, SMTP 등): 웹(HTTP), 이메일(SMTP), 파일전송(FTP) 같은 응용프로그램을 위한 프로토콜
  • L3 - 전송계층(TCP): 응용프로그램을 구분하는 포트 번호를 통해 컴퓨터에서 돌아가는 프로그램들 중 특정 응용 프로그램 하나를 찾아감
  • L2 - 인터넷 계층(IP) : IP 주소를 통해 수많은 컴퓨터들 중 특정 컴퓨터 하나를 찾아감
  • L1 - 네트워크 연결 계층: 전선과 장비들을 통해 물리적으로 데이터를 전송하기 위해 적절한 디지털/아날로그 신호 등등으로 변환함

응용 프로그램에서 데이터를 전송하면 각 프로토콜에 따라 패킷이 만들어지고, 아래 계층으로 내려가며 각 계층에 따라 다른 정보가 덧붙여져 간다. 이후 마지막 네트워크 계층에서 전선과 장치를 통해 인터넷으로 전송되고, 아래 계층부터 위 계층까지 차례대로 거쳐 프로토콜에 의해 원본 데이터에 해석된다.
이러한 구분을 통해 서로 간에 간섭이 최소화되어 편하고, 응용 계층에서는 응용 프로그램끼리의 해석만 신경 쓰면 되고 그 밑으로 각 계층마다 어떤 포트로, 어떤 IP로, 어떻게 디지털/아날로그 신호로 바꾸면되는지 따위를 신경만 쓰면된다.