제2장 자료의 표현

Standard

IT학부 C반 08611116 이준영



자료표현의 단위.


  – 비트 bit


  – 바이트 byte
  –
워드 word
  –
반워드 half word
  –
워드 full word
  – 2
배워드 double word



비트 (Bit)
  – 정보를 나타내는 최소 단위
  –
하나의 2진수값 (0 또는 1) 가짐


 


 


바이트 (Byte)
  –
문자를 표현하기위한 기본단위
  – 8Bit
를 묶어 하나의 문자 표시



 


워드 (Word)
  –
컴퓨터에서 명령을 처리하는 기본단위
  –
연산 레지스터의 크기를 의미


2)수의 체계와 진법

  – 10
진접123.456 = 1 × 10² + 2 × 10¹ + 3 × 10° + 4 × 10¯¹ + 5 × 10¯² + 6 × 10¯³
  – 2
진법 : 11112 = 1× 2³ + 1 × 2² + 1 × 2¹ + 1 × 2° = 8 + 4 + 2 + 1 = 1510  
  – 8
진수3458 = 3 × 8²  + 4 × 8¹ + 5 × 8°= 192 + 32 + 5 =22910 
  – 16
진수A × 16¹  + 3 × 16° = 16310 
                     160   +   3     163 (10)



3)수 변환
  – 2
진수 -> 10진수 변환      
   
n 비트의 값(value)Xn-1Xn-2 ․․․․  X2X1X0 이므로  
       Xn-12ⁿ¯¹ + Xn-22ⁿ¯² + ․․․․+X22² + X12¹ + X02° 로 표시

  –
10진수 -> 2진수


  – 10진수 -> 8진수

  – 소수점 부분변환
     0.125
에대한 2진수표현



  – 2진수와 8진수 관계
    
소수점을 기준으로 3자리씩 정수는 왼쪽방향으로 소수는 오른쪽방향으로 끊어 나간다. 3개가 8진수 1자리

  – 2진수와 16진수 관계
    
소수점을 기준으로 4자리씩 정수는 왼쪽방향으로 소수는 오른쪽방향으로 끊어 나간다. 4개가 16진수 1자리


 


4)보수
 보수는 컴퓨터 내부에서 수를 표시할 부호가 있는 음수를 표시하기 위해 사용하는 방법이며 또한 뺄셈 연산을 덧셈 연산으로 대체하기 위한방법
 
보수의 종류는 r-1보수와 r 보수 표현법이 있다. r-1보수 표현법은 기수 r 보다 1 축소된 형태로 2진수에서는 1 보수,10진수에서는 9 보수를 사용한다.
 r
보수 표현법은 r-1보수 보다 1 수이다.


 


(R-1)보수
    10
진수에서는 9 보수가 해당되며 2진수에서는 1 보수가 해당된다.


9 보수
      10
진수에서 9 보수를 구하는 방법은 9에서 각각의 숫자를 빼서 구한다.


 ) 12 대한 9 보수


                         99
                          -12
                         
───

                            87     12 대한 9 보수


 


1 보수
      2
진수에 대한 1 보수는 1 0으로, 0 1 변환한다.


    11011011 → 00100100


 


R 보수
     10
진수에서는 10 보수가 해당되며 2진수에서는 2 보수가 해당된다.
     10
진수에서는 10 보수가 해당되며 2진수에서는 2 보수가 해당

     (r-1)
보수를 구하여 가장 낮은 자리에 1 가산



    
10 보수
     9
보수에 1 더한 것과 같다.


   2 보수
   
 2진수에 대한 2 보수는 1 보수에 1 더하면 된다.


  001   → 110 대한 1 보수
          110
─────→   +  1   → 1 더한다
                                            
───
                                                 010   → 110 대한 2 보수


 2 – 2 수치 데이터


사칙 연산의 대상이 되는 데이터
 
연산과 데이터의 표현 방법에 따른 구분
 
고정 소수점 데이터 형식 (정수)
 
부동 소수점 데이터 표현 (실수
)
  10
데이터 형식


 


1)      고정 소수점 데이터형식


컴퓨터 내부에서 고정 소수점 데이터인 정수를 표현할 사용


             부호와 절대값방법(sigend magnitude)


             숫자를 나타낼 수앞에 ‘+’ 또는 ‘-‘부호를 붙여 나타낸다
            
수를 구성하는 비트열의 가장 왼쪽 최상위 비트를 부호 비트로 사용하여 값이 음수일 때는 1 양수일 때는 0으로 나타낸다.



                     35      0010 0011
                    -35      1010 1011


보수를 이용한 방법


 


부호와 1 보수에 의한 방법에서 양의 수를 나타내는 방법은 부호와 같으나 음수의 경우는 양수에 대한 1 보수 형태로 표현한다.
+17      0001 0001
 -17      1110 1110


 


부호와 2 보수


2 보수 개념은 1 보수에 1 더한 값과 같은데 음수는 2 보수에 의해 나타내 진다.


      +35     00100011


       -35     11011101


 


2)      10진수 데이터 형식


언팩 10진법 형식(unpacked decimal format)


1바이트 내에 10진수 1자리를 표현
10
진수 1자리를 8비트로 표현하게 되므로상위 니볼 왼쪽 4비트는 (zone), 나머지 4비트 하위 니불은 디지트(digit) 나타낸다.


 


[형식]


 


 


부분:  16진수 F(1111) 들어감  


숫자 부분:


최우측 바이트의  부분: 부호(+, -) 표시하는


 


 


 


언팩 10진법 형식(unpacked decimal format)


1985 -1985 10 진법 형식으로 표현


 


 


10진법 형식(packed decimal format)


[형식]


 


 


1바이트에 10진수 2자리를 표현


최하위 바이트의 하위 니불 디지트 부분에 부호가 들어간다.


1985 -1985 10 진법 형식으로 표현
팩 10진법 형식


3)      부동 소수점 데이터 표현


너무 수이거나 소수를 포함하는 너무 작은 수는 실수로 표현
소수점의 위치를 조절하여 제한된 비트로 정밀도를 보다 높게 표시할 있다.
많은 기억 공간의 필요와 연산이 느린 단점이 있다.



부동 소수점 표현법
부동 소수점은 소수(faction)부분과 지수(exponent)부분으로 구성된다


소수부분과 지수 부분을 조정하여 표현 가능한 범위를 조정할 있다.


소수는 수의 정밀도를 표현하고 지수는 수의 크기를 표현한다.


 


정규화


소수의 최상위 비트가 1 되도록 지수를 조정하고 소수의 최상위 비트 1 생략하여 표현하는 방법


정규화 과정을 통하여 얻은 1비트를 이용하여 소수점 이하 1자리를 더표현할 있으므로 정밀도를 높일 있는 환경제공


언더플로우(underflow) : 컴퓨터는 정규화된 부동소수점을 사용하며 이때 계산결과각 가장 작은 정규화된 부동 소수점보다 작으면 된다.


 


 


 


부동 소수점 데이터 형식


컴퓨터 내부에서 부동 소수점인 실수를 표현할 사용하는 형식


4바이트 실수형과 8바이트 실수형이 있다.


 


부동 소수점 데이터 형식
지수 부분에 대한 표현 가능한 영역의 범위


 


 


0.0001-50 × 10     X 0.9999 × 1049


 


 


IBM 360/370계열


 


 


IBM 360/370계열


 


14925 대한 실수 표현 방식


      14925 = 3A4D = 0.3A4D × 16


      지수부 = 64 + 4 = 68  (01000100)2 (44)16


      소수부 = 3A4D


 



IEEE754


 


 


IEEE754


 


10진수 0.75  IEEE 표준 형식 단정도로 표현


 


 


 


 


IEEE754


 


-2345.125 IEEE 표준 형식 단정도로 표현


 


 


오버플로우


지정된 메모리보다 많은 양의  메모리를 사용하려


10 진수 양수 6 5 더하는 과정


 


                   올림        0 1 


                         0 1 1 0        6


                     +) 0 1 0 1       5


                         1 0 1 1      → -4  


 


첫번째 비트는 부호 비트이므로 4비트로 표시할 있는 수의 범위는 -8 ~ 7 이다.  


오버플로우가 발생 (자리 올림의 비트가 1)


따라서 수를 더하면 10진수로 11 되지만 4 비트로는 나타낼 없다


 


 


2-3문자(비수치) 데이터 표현


 코드 : 0 1 조합에 의해 기계에 표현되는 숫자,문자,특수문자 등을 나타내기 위한 조합의 약속


 표준 방법


    ASCII코드
    BCD
코드
    EBCDIC
코드
   
유니코드
   
한글 표현


1)       ASCII코드


미국 정보 교환 표준 코드로서 7비트로 문자를 표현한다.


7비트의 조합으로 128개의 서로 다른 문자를 표시할 있도록 만들어진 코드


 


2)       BCD코드


하나의 문자를 데이터 비트 6자리와 패리티 비트1자리로 구성하여 64개의 문자를 표시할 있도록 만들어진 코드


존비트 : 데이터의 유형을 구분


디지트 비트 : 4개는 순서를 나타냄


 


3)       EBCDIC 코드 (확장 2진화 10 코드)


IBM시스템에서 사용하기 위해서 개발한 문자


2진화 10 코드의 앞부분에 2비트의 비트를 추가해서 확장한 코드


 


[코드 비교표]

        4)       유니코드


세계 국의 언어를 통일된 방법으로 표현할 있게 제안된 국제적인 코드 규약


2바이트 16비트로 표현


텍스트 : 인간이 읽을 있는 이련의글자와, 아스키와 같이 컴퓨터가 읽을수 있는 형식으로 변환가능한 단어


 


5)       한글표현


 


2바이트 조합형


현재 사용되는 한글 자소에 착안하여 16비트를 조합하여 음절을 표현


첫번째 비트 한글(1) , 영문(0)으로 구별


저장 효율이 높고 알고리즘이 간단함


국제표준기구 (ISO) 정보교환용 코드 확장법에 어긋나며 정보교환에는 부적절하다.


 


 


2바이트 완성형


음절 중심 표현


사용할 음절들에 사전식 순서로 14비트의 코드값을 배정


한글 처리 음절 테이블이 필요


 


[조합형과 완성형의 코드 비교]


               

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다