[딥 다이브 스터디] 23.12.14 - 데이터 타입

딥다이브 책에서 데이터 타입을 공부한 블로그입니다.
Dec 13, 2023
[딥 다이브 스터디] 23.12.14 - 데이터 타입

6.1 숫자 타입 (내가 발표😉)

정수 : 소수점 이하가 없는 숫자
실수 : 소수점 이하가 있는 숫자
C와 자바의 경우 정수와 실수를 구분해서 int, long, float, double등과 같은 다양한 숫자 타입을 제공한다.
하지만 자바스크립트는 독특하게 하나의 숫자 타입만 존재한다.
ECMAScript 사양에 따르면 숫자 타입의 값은 배정밀도 64비트 부동소수점 형식을 따른다.
 

ECMAScript가 뭐지?

ECMAScript가 표준입니다. JavaScript가 표준입니다. ECMAScript는 언어의 사양(Specification)입니다. JavaScript는 ECMAScript 표준을 따르는 언어입니다. ECMAScript는 표준화된 JavaScript입니다. ECMAScript는 언어입니다. JavaScript는 ECMAScript의 방언(Dialect)입니다. ECMAScript는 JavaScript입니다.
ECMAScript는 Ecma 인터내셔널에 의해 제정된 ECMA-262 기술 규격에 의해 정의된 범용 스크립트 언어입니다.
우리가 일상생활에서 쓰는 언어의 기준이 되는 국어를 표준어 라고 부르고, 국립국어원 에서 관리하고 있습니다. 그리고 표준어는 국립국어원에서 제정한 여러가지 규칙들 (대표적으로 발음이나 맞춤법)을 일정한 원리를 따르고 있습니다.
ECMAScript에서도 마찬가지입니다. 국립국어원은 Ecma 인터내셔널, ECMA-262는 표준어고, ECMAScript는 맞춤법과 같은 규칙으로 생각한다면 보다 쉽게 이해할 수 있겠습니다.
 
출처 ↓
 
돌아와서 즉 모든 수를 실수로 처리하며, 정수만 표현하기 위한 데이터 타입이 별도로 존재하지 않는다. 아래 예제를 보면
var integer = 10; // 정수 var double = 10.22; // 실수 var negative = -20; // 음의 정수
정수, 실수, 2진수, 8진수, 16진수 리터럴은 모두 메모리에 배정밀도 64비트 부동소수점 형식의 2진수로 저장된다고 한다.
자바스크립트는 2진수, 8진수, 16진수를 표현하기 위한 데이터 타입을 제공하지 않기 때문에 이들 값을 참조하면 모두 10진수로 해석된다.
 
자바스크립트의 숫자 타입은 정수만을 위한 타입이 없고 모든 수를 실수로 처리한다. 이전에 말했듯 이는 정수로 표시된다 해도 사실은 실수라는 것을 의미한다.
따라서 정수로 표시되는 수끼리 나누더라도 실수가 나올 수 있다.
let log = console.log; log(1 === 1.0); // true log(4 / 2); // 2 log(3 / 2); // 1.5
즉 숫자 타입은 추가적으로 세 가지 특별한 값도 표현할 수 있다.
Infinity : 양의 무한대
-Infinity : 음의 무한대
NaN : 산술 연산 불가
log(10 / 0); // Infinity log(10 / -0); // -Infinity log(1 * 'string'); // NaN
주의 자바스크립트는 대소문자를 구별하므로 NaN, Nan, nan과 같이 표현하면 에러가 발생하므로 주의해야한다. 자바스크립트 엔진은 NaN, Nan, nan을 값이 아닌 식별자로 해석한다.
 
var x = nan; log (x);
ReferenceError: nan is not defined
var x = NaN; log (x);
NaN

6.2 문자열 타입 (내가 발표😉)

궁극적으로 문자열 타입은 텍스트 데이터를 나타내는데 사용한다.
문자열은 0개 이상의 16비트 유니코드 문자(UTF-16)의 집합으로 전 세계 대부분의 문자를 표현할 수 있다. 문자열은 작은 따옴표(''), 큰 따옴표("") 또는 백틱(``)으로 텍스트를 감싼다.
자바스크립트의 가장 일반적인 표기법은
→ 작은 따옴표이다. ‘’;
'문자열' // 작따 "문자열" // 큰따 `문자열` // 백틱 '작은 따옴표로 감싼 문자열 내의 "큰 따옴표"는 문자열로 인식된다.' "큰따옴표로 감싼 문자열 내의 '작은 따옴표'는 문자열로 인식된다."
다른 타입의 값과 달리 문자열을 따옴표로 감싸는 이유는 키워드나 식별자 같은 토큰과 구분하기 위해서다. 만약 문자열을 따옴표로 감싸지 않으면 자바스크립트 엔진은 키워드나 식별자 같은 토큰으로 인식한다.
식별자는 코드 내의 변수함수, 혹은 속성을 식별하는 문자열입니다.
let log = console.log; var string = hello; log(string); ReferenceError: hello is not defined // ---------------------------------------- let log = console.log; var string = 'hello'; log(string); hello

6.3 템플릿 리터럴 (내가 발표😉)

ES6 부터 추가 된 문자열 표기법이다.
멀티라인 문자열, 표현식 삽입, 태그드 템플릿 등 편리한 처리 기능을 제공한다.
템플릿 리터럴은 런타임에 일반 문자열로 변환되어 처리된다.
템플릿 리터럴은 일반 문자열과 비슷해 보이지만 작은 따옴표('') 또는 큰 따옴표("") 같은 일반적인 따옴표 대신 백틱(``)을 사용해 표현한다.
let log = console.log; var template = `Template literal`; log(template); // Template literal

멀티라인 문자열

일반 문자열 내에서는 줄바꿈 (개행)이 허용되지 않는다.
notion image
따라서 일반 문자열 내에서 줄바꿈 등의 공백을 표현하려면 백슬래시(\)로 시작하는 이스케이프 시퀸스를 사용해야한다. → 표는 책에서 볼것
여기서 몇개 자주 썻던 것은
\b 백스페이스
\n 개행 다음행 이동
이었다.
var str = 'hello \n world';
notion image

표현식 삽입

문자열은 문자열 연산자 + 를 사용해 연결할 수 있다.
var first = 'yeochan'; var last = 'Youn'; log('나의 이름은 ' + first + ' ' + last + ' 이다.'); // 나의 이름은 yeochan Youn 이다.
템플릿 리터럴 내에서는 표현식 삽입을 통해 간단히 문자열을 삽입할 수 있다.
이를 통해 문자열 연산자보다 가독성 좋고 간편하게 문자열을 조합할 수 있다.
log(`나의 이름은 ${first} ${last} 이다.`); // 나의 이름은 yeochan Youn 이다.
확실히 더 가독성이 좋다. 표현식을 삽입하려면 ${} 으로 표현식을 감싸야한다.
이땐 주의 표현식의 평가 결과가 문자열이 아니더라도 문자열로 타입이 강제로 변환되어 삽입된다.
log(`1 + 2 = ${ 1 + 2 }`); log('1 + 2 = ${ 1 + 2 }'); // 1 + 2 = 3 // 1 + 2 = ${ 1 + 2 }

6.4 불리언 타입

불리언 타입의 값은 논리적 참, 거짓을 나타내는 true와 false 뿐이다.
let log = console.log; var bool = true; log (bool); // true bool = false; log (bool); // false
불리언 타입의 값은 참과 거짓으로 구분되는 조건에 의해 프로그램 흐름을 제어하는 조건문에서 자주 사용한다.

6.5 undefined 타입

undefined 타입의 값은 undefined 가 유일하다.
var 키워드로 선언한 변수는 암묵적으로 undefined로 초기화된다.
var bool; let bool1; log(bool); log(bool1);
확인해보니 let도 그렇다~
다시 말해, 변수 선언에 의해 확보 된 메모리 공간을 처음 할당이 이뤄질 때까지 빈 상태(대부분 비어 있지 않고 쓰레기 값 gerbage value이 들어있다.)로 내버려두지 않고 자바스크립트 엔진이 undefined로 초기화된다. 따라서 변수를 선언한 이후 값을 할당하지 않은 변수를 참조하면 undefined가 반환된다.
 
주의 이처럼 undefined는 개발자가 의도적으로 할당하기 위한 값이 아니라 자바스크립트 엔진이 변수를 초기화 할 때 사용하는 값이다.
 
이건… 나도 처음 알았는데
→ 자바스크립트 엔진이 변수를 초기화하는 데 사용하는 undefined를 개발자가 의도적으로 변수에 할당한다면 undefined의 본래의 취지와 어긋날 뿐더러 혼란을 줄 수 있으므로 권장되지 않는다.
이럴 땐?
→ 변수에 값이 없는 것을 명시하고 싶을 때는 undefined를 할당하는 것이 아니라 null을 할당한다.

6.6 null 타입

null 타입의 값은 null이 유일하다. 자바스크립트는 대소문자를 구별한다 했다.
그렇기에 null은 Null, NULL 등과는 다르다.
프로그래밍 언어에서 null은 변수에 값이 없다는 것을 의도적으로 명시(의도적인 부재)할 때 사용한다. 변수에 null을 할당하는 것은 변수가 이전에 참조하던 값을 더 이상 참조하지 않겠다는 의미다.
이는 이전에 할당되어 있던 값에 대한 참조를 명시적으로 제거하는 것을 의미하며, 자바스크립트 엔진은 누구도 참조하지 않는 메모리 공간에 대해 가비지 콜렉션을 수행할 것이다.
let log = console.log; var foo = 'youn'; log(foo); // youn foo = null; log(foo); // null
이전 참조를 제거하면서 foo 변수는 ‘youn’을 참조하지 않는다…
유용해 보이지 않기에 차라리 변수 자체를 재빨리 소멸시키는 편이 낫다고 한다.
 
함수가 유효한 값을 반환할 수 없는 경우 명시적으로 null을 반환하기도 한다.
HTML 요소를 검색해 반환하는 document.querySelector 메서드는 조건에 부합하는 HTML 요소를 검색할 수 없는 경우 에러 대신 null을 반환한다.
 
예제 확인!

6.7 심벌 타입

ES6에서 추가된 7번째 타입이다.
변경 불가능한 원시 타입의 값이다. 심벌 값은 다른 값과 중복되지 않는 유일무이한 값이다.
→ 주로 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용
심벌 이외의 원시 값은 리터럴을 통해 생성하지만 심벌은 Symbol 함수를 호출해 생성한다.
이때 생성된 심벌 값은 외부에 노출되지 않으며, 다른 값과 절대 중복되지 않는 유일무이한 값이다.
let log = console.log; var key = Symbol('key'); log (typeof key); // symbol var obj = {}; obj[key] = 'value'; log(obj); log(obj[key]); // symbol // { [Symbol(key)]: 'value' } // value

6.8 객체 타입

자바스크립트의 데이터 타입은 크게 원시 타입과 객체 타입으로 분류한다고 했다.
이유는? 원시 타입과 객체 타입은 근본적으로 다르다.
추후 11장에서 더 자세히 들어간다.
중요한 것은 자바스크립트는 객체 기반의 언어이며, 자바스크립트를 이루고 있는 모든 것이 객체라는 것이다.
 
위에서 본 6가지의 데이터 타입 이외의 모든 값은 객체 타입이다.

6.9 데이터 타입의 필요성

데이터 타입은 왜 필요한 것인가?

데이터 타입에 의한 메모리 공간의 확보와 참조

값은 메모리에 저장하고 참조한다.
메모리에 값을 저장하려면 먼저 확보해야 할 메모리 공간의 크기를 결정해야한다.
→ 몇 바이트의 메모리 공간을 사용해야 낭비와 손실이 없이 값을 저장할 수 있는지 알아야한다.
var score = 100
위 코드가 실행되면 컴퓨터는 숫자 값 100을 저장하기 위해 메모리 공간을 확보한 다음, 확보된 메모리에 숫자 값 100을 2진수로 저장한다.
이러한 처리를 하려면 숫자 값을 저장할 때 확보해야 할 메모리 공간의 크기를 알아야한다.
변수에 할당되는 값의 데이터 타입에 따라 확보해야 할 메모리 공간의 크기가 결정된다.
 
위 예제인 100은 어떻게 될까?
아래와 같이 8바이트의 메모리 공간을 확보해야한다.
그리고 아래와 같이 2진수로 저장한다.
00000000
00000000
00000000
00000000
00000000
00000000
00000000
01100100
자바스크립트는 숫자 타입의 값을 생성할 때 배정밀도 64비트 부동소수점 형식을 사용한다.
실제는 위와 다르지만 간단한 양의 정수로 저장된다고 생각하면된다.
값을 참조하는 경우를 생각하면, 식별자 score를 통해 숫자 타입의 값 100이 저장되어 있는 메모리 공간의 주소를 찾아갈 수 있다.
→ 이때 값을 참조하려면 한 번에 읽어 들여야 할 메모리 공간의 크기, 즉 메모리 셀의 개수(바이트 수)를 알아야 한다. score 변수의 경우 저장되어 있는 값이 숫자 타입이므로 8바이트 단위로 읽어 들이지 않으면 값이 훼손된다.
그렇다면? 컴퓨터는 한 번에 읽어 들여야 할 메모리 셀의 크기를 어떻게 알고 훼손하지 않게 데이터를 알 수 있을까?
→ 변수엔 숫자 타입의 값이 할당되어 있으므로 자바스크립트 엔진은 score 변수를 숫자 타입으로 인식한다. 숫자 타입은 8바이트 단위로 저장되므로 score 변수를 참조하면 8바이트 단위로 메모리 공간에 저장된 값을 읽어 들인다.
 

심벌 테이블

컴파일러 또는 인터프리터는 심벌 테이블이라고 부르는 자료 구조를 통해 식별자를 키로 바인딩 된 값의 메모리 주소, 데이터 타입, 스코프 등을 관리한다.

데이터 타입에 의한 값의 해석

메모리에서 읽어 들인 2진수를 어떻게 해석해야하느냐?
모든 값은 데이터 타입을 가지며, 메모리에 2진수, 즉 비트의 나열로 저장된다.
메모리에 저장된 값 0100 0001을 숫자로 해석하면 65 문자로 해석하면 ‘a’ 이다.
그렇게 score는 변수를 참조하면 메모리 공간의 주소에서 읽어 들인 2진수를 숫자로 해석한다.
 
중요데이터 타입이 필요한 이유는?
  • 값을 저장할 때 확보해야 하는 메모리 공간의 크기를 결정하기 위해
  • 값을 참조할 때 한 번에 읽어 들여야 할 메모리 공간의 크기를 결정하기 위해
  • 메모리에서 읽어 들인 2진수를 어떻게 해석할지 결정하기 위해

6.10 동적 타이핑 (내가 발표😉)

동적 타입 언어와 정적 타입 언어

자바스크립트의 모든 값은 데이터 타입을 갖는다.
그렇다면 변수는 데이터 타입을 가질까?
 
C나 자바 같은 정적 타입 언어는 변수를 선언할 때 변수에 할당할 수 있는 값의 종류, 즉 데이터 타입을 선언해주어야한다.
→ 이를 명시적 타입 선언이라 한다.
 
아래는 C에서 정수 타입의 변수를 선언하는 예시이다.
// c 변수에는 1바이트 정수 타입의 값 (-128 ~ 127)만 할당할 수 있다. char c; // num 변수에는 4바이트 정수 타입의 값 (-2,124,483,648 ~ 2,124,483,647)만 할당할 수 있다. int num;
정적 타입 언어는 변수의 타입을 변경할 수 없으며, 변수에 선언한 타입에 맞는 값만 할당할 수 있다.
→ 정적 타입 언어는 컴파일 시점에 타입 체크 (선언한 데이터 타입에 맞는 값을 할당했는지 검사)를 수행한다. 만약에 타입 체크를 통과 못하면 에러를 발생시키고 프로그램의 실행 자체를 막는다.
 
이렇게 되면 일관성을 강제함으로 안정적인 코드 구현을 통해 런타임에서 발생하는 에러가 준다.
 
자바스크립트는 정적 타입 언어와 다르게 변수를 선언할 때 타입을 선언하지 않는다.
var, lat, const 키워드를 사용해 변수를 선언할 뿐;
 
즉 자바스크립트는 타입에 상관없이 어떤 타입이라도 다 넣을 수 있다는 것을 의미!
 
let log = console.log; var foo; log(typeof foo); // undefined foo = null; log(typeof foo); // object foo = 3; log(typeof foo); // number foo = 'hello'; log(typeof foo); // string foo = true; log(typeof foo); // boolean foo = Symbol(); log(typeof foo); // symbol foo = {}; log(typeof foo); // object foo = []; log(typeof foo); // object foo = funtion () {}; log(typeof foo); // function
자바스크립트의 변수는 선언이 아닌 할당에 의해 타입이 결정(타입 추론) 된다.
그리고 재할당에 의해서 변수의 타입은 언제든지 동적으로 변할 수 있다.
→ 이것을 동적 타이핑이라고 한다.
 
첫 질문 그렇다면 변수는 데이터 타입을 가질까?
결론은 변수는 타입을 갖지 않는다. 하지만 값은 타입을 갖는다.
변수의 타입은 변수에 할당되어 있는 값에 따라 동적으로 결정된다.
notion image
 

동적 타입 언어와 변수

동적 타입 언어는 변수에 어떤 데이터 타입의 값이라도 자유롭게 할당할 수 있다.
이러한 동적 타입 언어의 특징은?
→ 결국 타입에 무감각해진다…
결국 이건 문제가 크다. 알수 없는 에러를 만나 고생할 수 있다는 점
 
자바스크립트는 개발자의 의도와는 상관없이 자바스크립트 엔진에 의해 암묵적으로 타입이 자동으로 변환되기도 한다.
 
이 이유 때문에 타입 스크립트가 등장했다.
그래도 타입 스크립트를 안쓰는 회사가 있을 수 있어 간단하게 설명하면
  • 변수는 꼭 필요한 경우에 한해 제한적으로 사용한다.
  • 변수의 유효 범위 (스코프)는 최대한 좁게 만들어 변수의 부작용을 억제해야한다.
  • 전역 변수는 최대한 사용하지 않도록한다.
  • 변수보다는 상수(const)를 사용해 값의 변경을 억제한다.
  • 변수 이름은 변수의 목적이나 의미를 파악할 수 있도록 네이밍한다.
 
가독성이 좋은 코드가 좋은 코드이다.
 
 
Share article
RSSPowered by inblog