936 lines
		
	
	
		
			37 KiB
		
	
	
	
		
			Factor
		
	
	
			
		
		
	
	
			936 lines
		
	
	
		
			37 KiB
		
	
	
	
		
			Factor
		
	
	
| ! Copyright (C) 2005, 2010 Slava Pestov, Joe Groff.
 | |
| ! See http://factorcode.org/license.txt for BSD license.
 | |
| USING: arrays io.binary kernel combinators
 | |
| combinators.short-circuit math math.bitwise locals namespaces
 | |
| make sequences words system layouts math.order accessors
 | |
| cpu.x86.assembler.operands cpu.x86.assembler.operands.private ;
 | |
| IN: cpu.x86.assembler
 | |
| 
 | |
| ! A postfix assembler for x86-32 and x86-64.
 | |
| 
 | |
| <PRIVATE
 | |
| 
 | |
| : reg-code ( reg -- n ) "register" word-prop 7 bitand ;
 | |
| 
 | |
| : indirect-base* ( op -- n ) base>> EBP or reg-code ;
 | |
| 
 | |
| : indirect-index* ( op -- n ) index>> ESP or reg-code ;
 | |
| 
 | |
| : indirect-scale* ( op -- n ) scale>> 0 or ;
 | |
| 
 | |
| GENERIC: sib-present? ( op -- ? )
 | |
| 
 | |
| M: indirect sib-present?
 | |
|     {
 | |
|         [ base>> { ESP RSP R12 } member? ]
 | |
|         [ index>> ]
 | |
|         [ scale>> ]
 | |
|     } 1|| ;
 | |
| 
 | |
| M: register sib-present? drop f ;
 | |
| 
 | |
| GENERIC: r/m ( operand -- n )
 | |
| 
 | |
| M: indirect r/m
 | |
|     dup sib-present?
 | |
|     [ drop ESP reg-code ] [ indirect-base* ] if ;
 | |
| 
 | |
| M: register r/m reg-code ;
 | |
| 
 | |
| ! Immediate operands
 | |
| UNION: immediate byte integer ;
 | |
| 
 | |
| GENERIC: fits-in-byte? ( value -- ? )
 | |
| 
 | |
| M: byte fits-in-byte? drop t ;
 | |
| 
 | |
| M: integer fits-in-byte? -128 127 between? ;
 | |
| 
 | |
| GENERIC: modifier ( op -- n )
 | |
| 
 | |
| M: indirect modifier
 | |
|     dup base>> [
 | |
|         displacement>> {
 | |
|             { [ dup not ] [ BIN: 00 ] }
 | |
|             { [ dup fits-in-byte? ] [ BIN: 01 ] }
 | |
|             { [ dup immediate? ] [ BIN: 10 ] }
 | |
|         } cond nip
 | |
|     ] [
 | |
|         drop BIN: 00
 | |
|     ] if ;
 | |
| 
 | |
| M: register modifier drop BIN: 11 ;
 | |
| 
 | |
| GENERIC# n, 1 ( value n -- )
 | |
| 
 | |
| M: integer n, >le % ;
 | |
| M: byte n, [ value>> ] dip n, ;
 | |
| : 1, ( n -- ) 1 n, ; inline
 | |
| : 4, ( n -- ) 4 n, ; inline
 | |
| : 2, ( n -- ) 2 n, ; inline
 | |
| : cell, ( n -- ) bootstrap-cell n, ; inline
 | |
| 
 | |
| : mod-r/m, ( reg operand -- )
 | |
|     [ 3 shift ] [ [ modifier 6 shift ] [ r/m ] bi ] bi* bitor bitor , ;
 | |
| 
 | |
| : sib, ( operand -- )
 | |
|     dup sib-present? [
 | |
|         [ indirect-base* ]
 | |
|         [ indirect-index* 3 shift ]
 | |
|         [ indirect-scale* 6 shift ] tri bitor bitor ,
 | |
|     ] [
 | |
|         drop
 | |
|     ] if ;
 | |
| 
 | |
| GENERIC: displacement, ( op -- )
 | |
| 
 | |
| M: indirect displacement,
 | |
|     dup displacement>> dup [
 | |
|         swap base>>
 | |
|         [ dup fits-in-byte? [ , ] [ 4, ] if ] [ 4, ] if
 | |
|     ] [ 2drop ] if ;
 | |
| 
 | |
| M: register displacement, drop ;
 | |
| 
 | |
| : addressing ( reg operand -- )
 | |
|     [ mod-r/m, ] [ sib, ] [ displacement, ] tri ;
 | |
| 
 | |
| : rex.w? ( rex.w reg r/m -- ? )
 | |
|     {
 | |
|         { [ over register-128? ] [ nip operand-64? ] }
 | |
|         { [ over not ] [ nip operand-64? ] }
 | |
|         [ drop operand-64? ]
 | |
|     } cond and ;
 | |
| 
 | |
| : rex.r ( m op -- n )
 | |
|     extended? [ BIN: 00000100 bitor ] when ;
 | |
| 
 | |
| : rex.b ( m op -- n )
 | |
|     [ extended? [ BIN: 00000001 bitor ] when ] keep
 | |
|     dup indirect? [ index>> extended? [ BIN: 00000010 bitor ] when ] [ drop ] if ;
 | |
| 
 | |
| : no-prefix? ( prefix reg r/m -- ? )
 | |
|     [ BIN: 01000000 = ]
 | |
|     [ extended-8-bit-register? not ]
 | |
|     [ extended-8-bit-register? not ] tri*
 | |
|     and and ;
 | |
| 
 | |
| :: rex-prefix ( reg r/m rex.w -- )
 | |
|     #! Compile an AMD64 REX prefix.
 | |
|     rex.w reg r/m rex.w? BIN: 01001000 BIN: 01000000 ?
 | |
|     reg rex.r
 | |
|     r/m rex.b
 | |
|     dup reg r/m no-prefix? [ drop ] [ , ] if ;
 | |
| 
 | |
| : 16-prefix ( reg -- )
 | |
|     register-16? [ HEX: 66 , ] when ;
 | |
| 
 | |
| : prefix-1 ( reg rex.w -- )
 | |
|     [ drop 16-prefix ] [ [ f ] 2dip rex-prefix ] 2bi ;
 | |
| 
 | |
| : short-operand ( reg rex.w n -- )
 | |
|     #! Some instructions encode their single operand as part of
 | |
|     #! the opcode.
 | |
|     [ dupd prefix-1 reg-code ] dip + , ;
 | |
| 
 | |
| : opcode, ( opcode -- ) dup array? [ % ] [ , ] if ;
 | |
| 
 | |
| : extended-opcode ( opcode -- opcode' )
 | |
|     dup array? [ OCT: 17 prefix ] [ OCT: 17 swap 2array ] if ;
 | |
| 
 | |
| : extended-opcode, ( opcode -- ) extended-opcode opcode, ;
 | |
| 
 | |
| : opcode-or ( opcode mask -- opcode' )
 | |
|     over array?
 | |
|     [ [ unclip-last ] dip bitor suffix ] [ bitor ] if ;
 | |
| 
 | |
| : 1-operand ( operand reg,rex.w,opcode -- )
 | |
|     #! The 'reg' is not really a register, but a value for the
 | |
|     #! 'reg' field of the mod-r/m byte.
 | |
|     first3 [ [ over ] dip prefix-1 ] dip opcode, swap addressing ;
 | |
| 
 | |
| : immediate-operand-size-bit ( dst imm reg,rex.w,opcode -- imm dst reg,rex.w,opcode )
 | |
|     over integer? [ first3 BIN: 1 opcode-or 3array ] when ;
 | |
| 
 | |
| : immediate-1* ( dst imm reg,rex.w,opcode -- )
 | |
|     swap [ 1-operand ] dip 1, ;
 | |
| 
 | |
| : immediate-1 ( dst imm reg,rex.w,opcode -- )
 | |
|     immediate-operand-size-bit immediate-1* ;
 | |
| 
 | |
| : immediate-4 ( dst imm reg,rex.w,opcode -- )
 | |
|     immediate-operand-size-bit swap [ 1-operand ] dip 4, ;
 | |
| 
 | |
| : immediate-fits-in-size-bit ( dst imm reg,rex.w,opcode -- imm dst reg,rex.w,opcode )
 | |
|     over integer? [ first3 BIN: 10 opcode-or 3array ] when ;
 | |
| 
 | |
| : immediate-1/4 ( dst imm reg,rex.w,opcode -- )
 | |
|     #! If imm is a byte, compile the opcode and the byte.
 | |
|     #! Otherwise, set the 8-bit operand flag in the opcode, and
 | |
|     #! compile the cell. The 'reg' is not really a register, but
 | |
|     #! a value for the 'reg' field of the mod-r/m byte.
 | |
|     over fits-in-byte? [
 | |
|         immediate-fits-in-size-bit immediate-1
 | |
|     ] [
 | |
|         immediate-4
 | |
|     ] if ;
 | |
| 
 | |
| : (2-operand) ( reg operand op -- )
 | |
|     [ 2dup t rex-prefix ] dip opcode,
 | |
|     [ reg-code ] dip addressing ;
 | |
| 
 | |
| : direction-bit ( dst src op -- reg operand op' )
 | |
|     pick register? pick register? not and
 | |
|     [ BIN: 10 opcode-or ] [ swapd ] if ;
 | |
| 
 | |
| : operand-size-bit ( reg operand op -- reg operand op' )
 | |
|     pick register-8? [ BIN: 1 opcode-or ] unless ;
 | |
| 
 | |
| : 2-operand ( dst src op -- )
 | |
|     direction-bit operand-size-bit
 | |
|     pick 16-prefix
 | |
|     (2-operand) ;
 | |
| 
 | |
| PRIVATE>
 | |
| 
 | |
| ! Segment override prefixes
 | |
| : CS ( -- ) HEX: 2e , ;
 | |
| : ES ( -- ) HEX: 26 , ;
 | |
| : SS ( -- ) HEX: 36 , ;
 | |
| : FS ( -- ) HEX: 64 , ;
 | |
| : GS ( -- ) HEX: 65 , ;
 | |
| 
 | |
| ! Moving stuff
 | |
| GENERIC: PUSH ( op -- )
 | |
| M: register PUSH f HEX: 50 short-operand ;
 | |
| M: immediate PUSH HEX: 68 , 4, ;
 | |
| M: operand PUSH { BIN: 110 f HEX: ff } 1-operand ;
 | |
| 
 | |
| GENERIC: POP ( op -- )
 | |
| M: register POP f HEX: 58 short-operand ;
 | |
| M: operand POP { BIN: 000 f HEX: 8f } 1-operand ;
 | |
| 
 | |
| ! MOV where the src is immediate.
 | |
| <PRIVATE
 | |
| 
 | |
| GENERIC# (MOV-I) 1 ( dst src -- )
 | |
| 
 | |
| M: register (MOV-I)
 | |
|     dup byte?
 | |
|     [ [ t HEX: b0 short-operand ] [ 1, ] bi* ]
 | |
|     [ [ t HEX: b8 short-operand ] [ cell, ] bi* ]
 | |
|     if ;
 | |
| 
 | |
| M: operand (MOV-I)
 | |
|     { BIN: 000 t HEX: c6 }
 | |
|     over byte? [ immediate-1 ] [ immediate-4 ] if ;
 | |
| 
 | |
| PRIVATE>
 | |
| 
 | |
| GENERIC: MOV ( dst src -- )
 | |
| M: immediate MOV (MOV-I) ;
 | |
| M: operand MOV HEX: 88 2-operand ;
 | |
| 
 | |
| : LEA ( dst src -- ) swap HEX: 8d 2-operand ;
 | |
| 
 | |
| ! Control flow
 | |
| GENERIC: JMP ( op -- )
 | |
| M: integer JMP HEX: e9 , 4, ;
 | |
| M: operand JMP { BIN: 100 t HEX: ff } 1-operand ;
 | |
| 
 | |
| GENERIC: CALL ( op -- )
 | |
| M: integer CALL HEX: e8 , 4, ;
 | |
| M: operand CALL { BIN: 010 t HEX: ff } 1-operand ;
 | |
| 
 | |
| <PRIVATE
 | |
| 
 | |
| GENERIC# JUMPcc 1 ( addr opcode -- )
 | |
| M: integer JUMPcc extended-opcode, 4, ;
 | |
| 
 | |
| : SETcc ( dst opcode -- )
 | |
|     { BIN: 000 t } swap suffix 1-operand ;
 | |
| 
 | |
| PRIVATE>
 | |
| 
 | |
| : JO  ( dst -- ) HEX: 80 JUMPcc ;
 | |
| : JNO ( dst -- ) HEX: 81 JUMPcc ;
 | |
| : JB  ( dst -- ) HEX: 82 JUMPcc ;
 | |
| : JAE ( dst -- ) HEX: 83 JUMPcc ;
 | |
| : JE  ( dst -- ) HEX: 84 JUMPcc ; ! aka JZ
 | |
| : JNE ( dst -- ) HEX: 85 JUMPcc ;
 | |
| : JBE ( dst -- ) HEX: 86 JUMPcc ;
 | |
| : JA  ( dst -- ) HEX: 87 JUMPcc ;
 | |
| : JS  ( dst -- ) HEX: 88 JUMPcc ;
 | |
| : JNS ( dst -- ) HEX: 89 JUMPcc ;
 | |
| : JP  ( dst -- ) HEX: 8a JUMPcc ;
 | |
| : JNP ( dst -- ) HEX: 8b JUMPcc ;
 | |
| : JL  ( dst -- ) HEX: 8c JUMPcc ;
 | |
| : JGE ( dst -- ) HEX: 8d JUMPcc ;
 | |
| : JLE ( dst -- ) HEX: 8e JUMPcc ;
 | |
| : JG  ( dst -- ) HEX: 8f JUMPcc ;
 | |
| 
 | |
| : SETO  ( dst -- ) { HEX: 0f HEX: 90 } SETcc ;
 | |
| : SETNO ( dst -- ) { HEX: 0f HEX: 91 } SETcc ;
 | |
| : SETB  ( dst -- ) { HEX: 0f HEX: 92 } SETcc ;
 | |
| : SETAE ( dst -- ) { HEX: 0f HEX: 93 } SETcc ;
 | |
| : SETE  ( dst -- ) { HEX: 0f HEX: 94 } SETcc ;
 | |
| : SETNE ( dst -- ) { HEX: 0f HEX: 95 } SETcc ;
 | |
| : SETBE ( dst -- ) { HEX: 0f HEX: 96 } SETcc ;
 | |
| : SETA  ( dst -- ) { HEX: 0f HEX: 97 } SETcc ;
 | |
| : SETS  ( dst -- ) { HEX: 0f HEX: 98 } SETcc ;
 | |
| : SETNS ( dst -- ) { HEX: 0f HEX: 99 } SETcc ;
 | |
| : SETP  ( dst -- ) { HEX: 0f HEX: 9a } SETcc ;
 | |
| : SETNP ( dst -- ) { HEX: 0f HEX: 9b } SETcc ;
 | |
| : SETL  ( dst -- ) { HEX: 0f HEX: 9c } SETcc ;
 | |
| : SETGE ( dst -- ) { HEX: 0f HEX: 9d } SETcc ;
 | |
| : SETLE ( dst -- ) { HEX: 0f HEX: 9e } SETcc ;
 | |
| : SETG  ( dst -- ) { HEX: 0f HEX: 9f } SETcc ;
 | |
| 
 | |
| : LEAVE ( -- ) HEX: c9 , ;
 | |
| 
 | |
| : RET ( n -- )
 | |
|     dup zero? [ drop HEX: c3 , ] [ HEX: c2 , 2, ] if ;
 | |
| 
 | |
| ! Arithmetic
 | |
| 
 | |
| GENERIC: ADD ( dst src -- )
 | |
| M: immediate ADD { BIN: 000 t HEX: 80 } immediate-1/4 ;
 | |
| M: operand ADD OCT: 000 2-operand ;
 | |
| 
 | |
| GENERIC: OR ( dst src -- )
 | |
| M: immediate OR { BIN: 001 t HEX: 80 } immediate-1/4 ;
 | |
| M: operand OR OCT: 010 2-operand ;
 | |
| 
 | |
| GENERIC: ADC ( dst src -- )
 | |
| M: immediate ADC { BIN: 010 t HEX: 80 } immediate-1/4 ;
 | |
| M: operand ADC OCT: 020 2-operand ;
 | |
| 
 | |
| GENERIC: SBB ( dst src -- )
 | |
| M: immediate SBB { BIN: 011 t HEX: 80 } immediate-1/4 ;
 | |
| M: operand SBB OCT: 030 2-operand ;
 | |
| 
 | |
| GENERIC: AND ( dst src -- )
 | |
| M: immediate AND { BIN: 100 t HEX: 80 } immediate-1/4 ;
 | |
| M: operand AND OCT: 040 2-operand ;
 | |
| 
 | |
| GENERIC: SUB ( dst src -- )
 | |
| M: immediate SUB { BIN: 101 t HEX: 80 } immediate-1/4 ;
 | |
| M: operand SUB OCT: 050 2-operand ;
 | |
| 
 | |
| GENERIC: XOR ( dst src -- )
 | |
| M: immediate XOR { BIN: 110 t HEX: 80 } immediate-1/4 ;
 | |
| M: operand XOR OCT: 060 2-operand ;
 | |
| 
 | |
| GENERIC: CMP ( dst src -- )
 | |
| M: immediate CMP { BIN: 111 t HEX: 80 } immediate-1/4 ;
 | |
| M: operand CMP OCT: 070 2-operand ;
 | |
| 
 | |
| GENERIC: TEST ( dst src -- )
 | |
| M: immediate TEST { BIN: 0 t HEX: f7 } immediate-4 ;
 | |
| M: operand TEST OCT: 204 2-operand ;
 | |
| 
 | |
| : XCHG ( dst src -- ) OCT: 207 2-operand ;
 | |
| 
 | |
| : BSR ( dst src -- ) { HEX: 0f HEX: bd } (2-operand) ;
 | |
| 
 | |
| GENERIC: BT ( value n -- )
 | |
| M: immediate BT ( value n -- ) { BIN: 100 t { HEX: 0f HEX: ba } } immediate-1* ;
 | |
| M: operand   BT ( value n -- ) swap { HEX: 0f HEX: a3 } (2-operand) ;
 | |
| 
 | |
| GENERIC: BTC ( value n -- )
 | |
| M: immediate BTC ( value n -- ) { BIN: 111 t { HEX: 0f HEX: ba } } immediate-1* ;
 | |
| M: operand   BTC ( value n -- ) swap { HEX: 0f HEX: bb } (2-operand) ;
 | |
| 
 | |
| GENERIC: BTR ( value n -- )
 | |
| M: immediate BTR ( value n -- ) { BIN: 110 t { HEX: 0f HEX: ba } } immediate-1* ;
 | |
| M: operand   BTR ( value n -- ) swap { HEX: 0f HEX: b3 } (2-operand) ;
 | |
| 
 | |
| GENERIC: BTS ( value n -- )
 | |
| M: immediate BTS ( value n -- ) { BIN: 101 t { HEX: 0f HEX: ba } } immediate-1* ;
 | |
| M: operand   BTS ( value n -- ) swap { HEX: 0f HEX: ab } (2-operand) ;
 | |
| 
 | |
| : NOT  ( dst -- ) { BIN: 010 t HEX: f7 } 1-operand ;
 | |
| : NEG  ( dst -- ) { BIN: 011 t HEX: f7 } 1-operand ;
 | |
| : MUL  ( dst -- ) { BIN: 100 t HEX: f7 } 1-operand ;
 | |
| : IMUL ( src -- ) { BIN: 101 t HEX: f7 } 1-operand ;
 | |
| : DIV  ( dst -- ) { BIN: 110 t HEX: f7 } 1-operand ;
 | |
| : IDIV ( src -- ) { BIN: 111 t HEX: f7 } 1-operand ;
 | |
| 
 | |
| : CDQ ( -- ) HEX: 99 , ;
 | |
| : CQO ( -- ) HEX: 48 , CDQ ;
 | |
| 
 | |
| <PRIVATE
 | |
| 
 | |
| :: (SHIFT) ( dst src op -- )
 | |
|     src CL eq? [
 | |
|         dst { op t HEX: d3 } 1-operand
 | |
|     ] [
 | |
|         dst src { op t HEX: c0 } immediate-1
 | |
|     ] if ; inline
 | |
| 
 | |
| PRIVATE>
 | |
| 
 | |
| : ROL ( dst n -- ) BIN: 000 (SHIFT) ;
 | |
| : ROR ( dst n -- ) BIN: 001 (SHIFT) ;
 | |
| : RCL ( dst n -- ) BIN: 010 (SHIFT) ;
 | |
| : RCR ( dst n -- ) BIN: 011 (SHIFT) ;
 | |
| : SHL ( dst n -- ) BIN: 100 (SHIFT) ;
 | |
| : SHR ( dst n -- ) BIN: 101 (SHIFT) ;
 | |
| : SAR ( dst n -- ) BIN: 111 (SHIFT) ;
 | |
| 
 | |
| : IMUL2 ( dst src -- )
 | |
|     OCT: 257 extended-opcode (2-operand) ;
 | |
| 
 | |
| : IMUL3 ( dst src imm -- )
 | |
|     dup fits-in-byte? [
 | |
|         [ swap HEX: 6a 2-operand ] dip 1,
 | |
|     ] [
 | |
|         [ swap HEX: 68 2-operand ] dip 4,
 | |
|     ] if ;
 | |
| 
 | |
| : MOVSX ( dst src -- )
 | |
|     dup register-32? OCT: 143 OCT: 276 extended-opcode ?
 | |
|     over register-16? [ BIN: 1 opcode-or ] when
 | |
|     (2-operand) ;
 | |
| 
 | |
| : MOVZX ( dst src -- )
 | |
|     OCT: 266 extended-opcode
 | |
|     over register-16? [ BIN: 1 opcode-or ] when
 | |
|     (2-operand) ;
 | |
| 
 | |
| ! Conditional move
 | |
| : MOVcc ( dst src cc -- ) extended-opcode (2-operand) ;
 | |
| 
 | |
| : CMOVO  ( dst src -- ) HEX: 40 MOVcc ;
 | |
| : CMOVNO ( dst src -- ) HEX: 41 MOVcc ;
 | |
| : CMOVB  ( dst src -- ) HEX: 42 MOVcc ;
 | |
| : CMOVAE ( dst src -- ) HEX: 43 MOVcc ;
 | |
| : CMOVE  ( dst src -- ) HEX: 44 MOVcc ; ! aka CMOVZ
 | |
| : CMOVNE ( dst src -- ) HEX: 45 MOVcc ;
 | |
| : CMOVBE ( dst src -- ) HEX: 46 MOVcc ;
 | |
| : CMOVA  ( dst src -- ) HEX: 47 MOVcc ;
 | |
| : CMOVS  ( dst src -- ) HEX: 48 MOVcc ;
 | |
| : CMOVNS ( dst src -- ) HEX: 49 MOVcc ;
 | |
| : CMOVP  ( dst src -- ) HEX: 4a MOVcc ;
 | |
| : CMOVNP ( dst src -- ) HEX: 4b MOVcc ;
 | |
| : CMOVL  ( dst src -- ) HEX: 4c MOVcc ;
 | |
| : CMOVGE ( dst src -- ) HEX: 4d MOVcc ;
 | |
| : CMOVLE ( dst src -- ) HEX: 4e MOVcc ;
 | |
| : CMOVG  ( dst src -- ) HEX: 4f MOVcc ;
 | |
| 
 | |
| ! CPU Identification
 | |
| 
 | |
| : CPUID ( -- ) HEX: a2 extended-opcode, ;
 | |
| 
 | |
| ! Misc
 | |
| 
 | |
| : NOP ( -- ) HEX: 90 , ;
 | |
| : PAUSE ( -- ) HEX: f3 , HEX: 90 , ;
 | |
| 
 | |
| : RDTSC ( -- ) HEX: 0f , HEX: 31 , ;
 | |
| : RDPMC ( -- ) HEX: 0f , HEX: 33 , ;
 | |
| 
 | |
| ! x87 Floating Point Unit
 | |
| 
 | |
| : FSTPS ( operand -- ) { BIN: 011 f HEX: d9 } 1-operand ;
 | |
| : FSTPL ( operand -- ) { BIN: 011 f HEX: dd } 1-operand ;
 | |
| 
 | |
| : FLDS ( operand -- ) { BIN: 000 f HEX: d9 } 1-operand ;
 | |
| : FLDL ( operand -- ) { BIN: 000 f HEX: dd } 1-operand ;
 | |
| 
 | |
| : FNSTCW ( operand -- ) { BIN: 111 f HEX: d9 } 1-operand ;
 | |
| : FNSTSW ( operand -- ) { BIN: 111 f HEX: dd } 1-operand ;
 | |
| : FLDCW ( operand -- ) { BIN: 101 f HEX: d9 } 1-operand ;
 | |
| 
 | |
| : FNCLEX ( -- ) HEX: db , HEX: e2 , ;
 | |
| : FNINIT ( -- ) HEX: db , HEX: e3 , ;
 | |
| 
 | |
| ERROR: bad-x87-operands ;
 | |
| 
 | |
| <PRIVATE
 | |
| 
 | |
| :: (x87-op) ( operand opcode reg -- )
 | |
|     opcode ,
 | |
|     BIN: 1100,0000 reg
 | |
|     3 shift bitor
 | |
|     operand reg-code bitor , ;
 | |
| 
 | |
| :: x87-st0-op ( src opcode reg -- )
 | |
|     src register?
 | |
|     [ src opcode reg (x87-op) ]
 | |
|     [ bad-x87-operands ] if ;
 | |
| 
 | |
| :: x87-m-st0/n-op ( dst src opcode reg -- )
 | |
|     {
 | |
|         { [ dst ST0 = src indirect? and ] [
 | |
|             src { reg f opcode } 1-operand
 | |
|         ] }
 | |
|         { [ dst ST0 = src register? and ] [
 | |
|             src opcode reg (x87-op)
 | |
|         ] }
 | |
|         { [ src ST0 = dst register? and ] [
 | |
|             dst opcode 4 + reg (x87-op)
 | |
|         ] }
 | |
|         [ bad-x87-operands ]
 | |
|     } cond ;
 | |
| 
 | |
| PRIVATE>
 | |
| 
 | |
| : F2XM1 ( -- ) { HEX: D9 HEX: F0 } % ;
 | |
| : FABS ( -- ) { HEX: D9 HEX: E1 } % ;
 | |
| : FADD ( dst src -- ) HEX: D8 0 x87-m-st0/n-op ;
 | |
| : FCHS ( -- ) { HEX: D9 HEX: E0 } % ;
 | |
| 
 | |
| : FCMOVB   ( src -- ) HEX: DA 0 x87-st0-op ;
 | |
| : FCMOVE   ( src -- ) HEX: DA 1 x87-st0-op ;
 | |
| : FCMOVBE  ( src -- ) HEX: DA 2 x87-st0-op ;
 | |
| : FCMOVU   ( src -- ) HEX: DA 3 x87-st0-op ;
 | |
| : FCMOVNB  ( src -- ) HEX: DB 0 x87-st0-op ;
 | |
| : FCMOVNE  ( src -- ) HEX: DB 1 x87-st0-op ;
 | |
| : FCMOVNBE ( src -- ) HEX: DB 2 x87-st0-op ;
 | |
| : FCMOVNU  ( src -- ) HEX: DB 3 x87-st0-op ;
 | |
| 
 | |
| : FCOMI ( src -- ) HEX: DB 6 x87-st0-op ;
 | |
| : FUCOMI ( src -- ) HEX: DB 5 x87-st0-op ;
 | |
| : FCOS ( -- ) { HEX: D9 HEX: FF } % ;
 | |
| : FDECSTP ( -- ) { HEX: D9 HEX: F6 } % ;
 | |
| : FINCSTP ( -- ) { HEX: D9 HEX: F7 } % ;
 | |
| : FDIV  ( dst src -- ) HEX: D8 6 x87-m-st0/n-op ;
 | |
| : FDIVR ( dst src -- ) HEX: D8 7 x87-m-st0/n-op ;
 | |
| 
 | |
| : FILDD ( src -- )  { BIN: 000 f HEX: DB } 1-operand ;
 | |
| : FILDQ ( src -- )  { BIN: 101 f HEX: DF } 1-operand ;
 | |
| : FISTPD ( dst -- ) { BIN: 011 f HEX: DB } 1-operand ;
 | |
| : FISTPQ ( dst -- ) { BIN: 111 f HEX: DF } 1-operand ;
 | |
| : FISTTPD ( dst -- ) { BIN: 001 f HEX: DB } 1-operand ;
 | |
| : FISTTPQ ( dst -- ) { BIN: 001 f HEX: DF } 1-operand ;
 | |
| 
 | |
| : FLD    ( src -- ) HEX: D9 0 x87-st0-op ;
 | |
| : FLD1   ( -- ) { HEX: D9 HEX: E8 } % ;
 | |
| : FLDL2T ( -- ) { HEX: D9 HEX: E9 } % ;
 | |
| : FLDL2E ( -- ) { HEX: D9 HEX: EA } % ;
 | |
| : FLDPI  ( -- ) { HEX: D9 HEX: EB } % ;
 | |
| : FLDLG2 ( -- ) { HEX: D9 HEX: EC } % ;
 | |
| : FLDLN2 ( -- ) { HEX: D9 HEX: ED } % ;
 | |
| : FLDZ   ( -- ) { HEX: D9 HEX: EE } % ;
 | |
| 
 | |
| : FMUL ( dst src -- ) HEX: D8 1 x87-m-st0/n-op ;
 | |
| : FNOP ( -- ) { HEX: D9 HEX: D0 } % ;
 | |
| : FPATAN ( -- ) { HEX: D9 HEX: F3 } % ;
 | |
| : FPREM  ( -- ) { HEX: D9 HEX: F8 } % ;
 | |
| : FPREM1 ( -- ) { HEX: D9 HEX: F5 } % ;
 | |
| : FRNDINT ( -- ) { HEX: D9 HEX: FC } % ;
 | |
| : FSCALE ( -- ) { HEX: D9 HEX: FD } % ;
 | |
| : FSIN ( -- ) { HEX: D9 HEX: FE } % ;
 | |
| : FSINCOS ( -- ) { HEX: D9 HEX: FB } % ;
 | |
| : FSQRT ( -- ) { HEX: D9 HEX: FA } % ;
 | |
| 
 | |
| : FSUB  ( dst src -- ) HEX: D8 HEX: 4 x87-m-st0/n-op ;
 | |
| : FSUBR ( dst src -- ) HEX: D8 HEX: 5 x87-m-st0/n-op ;
 | |
| 
 | |
| : FST  ( src -- ) HEX: DD 2 x87-st0-op ;
 | |
| : FSTP ( src -- ) HEX: DD 3 x87-st0-op ;
 | |
| 
 | |
| : FXAM ( -- ) { HEX: D9 HEX: E5 } % ;
 | |
| : FXCH ( src -- ) HEX: D9 1 x87-st0-op ;
 | |
| 
 | |
| : FXTRACT ( -- ) { HEX: D9 HEX: F4 } % ;
 | |
| : FYL2X ( -- ) { HEX: D9 HEX: F1 } % ;
 | |
| : FYL2XP1 ( -- ) { HEX: D9 HEX: F1 } % ;
 | |
| 
 | |
| ! SSE multimedia instructions
 | |
| 
 | |
| <PRIVATE
 | |
| 
 | |
| : direction-bit-sse ( dst src op1 -- dst' src' op1' )
 | |
|     pick register-128? [ swapd BIN: 1 bitor ] unless ;
 | |
| 
 | |
| : 2-operand-sse ( dst src op1 op2 -- )
 | |
|     [ , ] when* direction-bit-sse extended-opcode (2-operand) ;
 | |
| 
 | |
| : direction-op-sse ( dst src op1s -- dst' src' op1' )
 | |
|     pick register-128? [ first ] [ swapd second ] if ;
 | |
| 
 | |
| : 2-operand-rm-mr-sse ( dst src op1{rm,mr} op2 -- )
 | |
|     [ , ] when* direction-op-sse extended-opcode (2-operand) ;
 | |
| 
 | |
| : 2-operand-rm-mr-sse* ( dst src op12{rm,mr} -- )
 | |
|     direction-op-sse first2 [ , ] when* extended-opcode (2-operand) ;
 | |
| 
 | |
| : 2-operand-rm-sse ( dst src op1 op2 -- )
 | |
|     [ , ] when* extended-opcode (2-operand) ;
 | |
| 
 | |
| : 2-operand-mr-sse ( dst src op1 op2 -- )
 | |
|     [ , ] when* extended-opcode swapd (2-operand) ;
 | |
| 
 | |
| : 2-operand-int/sse ( dst src op1 op2 -- )
 | |
|     [ , ] when* extended-opcode (2-operand) ;
 | |
| 
 | |
| :: 3-operand-rm-sse ( dst src imm op1 op2 -- )
 | |
|     dst src op1 op2 2-operand-rm-sse imm , ;
 | |
| 
 | |
| :: 3-operand-mr-sse ( dst src imm op1 op2 -- )
 | |
|     dst src op1 op2 2-operand-mr-sse imm , ;
 | |
| 
 | |
| :: 3-operand-rm-mr-sse ( dst src imm op1 op2 -- )
 | |
|     dst src op1 op2 2-operand-rm-mr-sse imm , ;
 | |
| 
 | |
| : 2-operand-sse-cmp ( dst src cmp op1 op2 -- )
 | |
|     3-operand-rm-sse ; inline
 | |
| 
 | |
| : 2-operand-sse-shift ( dst imm reg op1 op2 -- )
 | |
|     [ , ] when*
 | |
|     [ f HEX: 0f ] dip 2array 3array
 | |
|     swapd 1-operand , ;
 | |
| 
 | |
| PRIVATE>
 | |
| 
 | |
| : MOVUPS     ( dest src -- ) HEX: 10 f       2-operand-sse ;
 | |
| : MOVUPD     ( dest src -- ) HEX: 10 HEX: 66 2-operand-sse ;
 | |
| : MOVSD      ( dest src -- ) HEX: 10 HEX: f2 2-operand-sse ;
 | |
| : MOVSS      ( dest src -- ) HEX: 10 HEX: f3 2-operand-sse ;
 | |
| : MOVLPS     ( dest src -- ) HEX: 12 f       2-operand-sse ;
 | |
| : MOVLPD     ( dest src -- ) HEX: 12 HEX: 66 2-operand-sse ;
 | |
| : MOVDDUP    ( dest src -- ) HEX: 12 HEX: f2 2-operand-rm-sse ;
 | |
| : MOVSLDUP   ( dest src -- ) HEX: 12 HEX: f3 2-operand-rm-sse ;
 | |
| : UNPCKLPS   ( dest src -- ) HEX: 14 f       2-operand-rm-sse ;
 | |
| : UNPCKLPD   ( dest src -- ) HEX: 14 HEX: 66 2-operand-rm-sse ;
 | |
| : UNPCKHPS   ( dest src -- ) HEX: 15 f       2-operand-rm-sse ;
 | |
| : UNPCKHPD   ( dest src -- ) HEX: 15 HEX: 66 2-operand-rm-sse ;
 | |
| : MOVHPS     ( dest src -- ) HEX: 16 f       2-operand-sse ;
 | |
| : MOVHPD     ( dest src -- ) HEX: 16 HEX: 66 2-operand-sse ;
 | |
| : MOVSHDUP   ( dest src -- ) HEX: 16 HEX: f3 2-operand-rm-sse ;
 | |
| 
 | |
| ALIAS: MOVHLPS MOVLPS
 | |
| ALIAS: MOVLHPS MOVHPS
 | |
| 
 | |
| : PREFETCHNTA ( mem -- )  { BIN: 000 f { HEX: 0f HEX: 18 } } 1-operand ;
 | |
| : PREFETCHT0  ( mem -- )  { BIN: 001 f { HEX: 0f HEX: 18 } } 1-operand ;
 | |
| : PREFETCHT1  ( mem -- )  { BIN: 010 f { HEX: 0f HEX: 18 } } 1-operand ;
 | |
| : PREFETCHT2  ( mem -- )  { BIN: 011 f { HEX: 0f HEX: 18 } } 1-operand ;
 | |
| 
 | |
| : MOVAPS     ( dest src -- ) HEX: 28 f       2-operand-sse ;
 | |
| : MOVAPD     ( dest src -- ) HEX: 28 HEX: 66 2-operand-sse ;
 | |
| : CVTSI2SD   ( dest src -- ) HEX: 2a HEX: f2 2-operand-int/sse ;
 | |
| : CVTSI2SS   ( dest src -- ) HEX: 2a HEX: f3 2-operand-int/sse ;
 | |
| : MOVNTPS    ( dest src -- ) HEX: 2b f       2-operand-mr-sse ;
 | |
| : MOVNTPD    ( dest src -- ) HEX: 2b HEX: 66 2-operand-mr-sse ;
 | |
| : CVTTSD2SI  ( dest src -- ) HEX: 2c HEX: f2 2-operand-int/sse ;
 | |
| : CVTTSS2SI  ( dest src -- ) HEX: 2c HEX: f3 2-operand-int/sse ;
 | |
| : CVTSD2SI   ( dest src -- ) HEX: 2d HEX: f2 2-operand-int/sse ;
 | |
| : CVTSS2SI   ( dest src -- ) HEX: 2d HEX: f3 2-operand-int/sse ;
 | |
| : UCOMISS    ( dest src -- ) HEX: 2e f       2-operand-rm-sse ;
 | |
| : UCOMISD    ( dest src -- ) HEX: 2e HEX: 66 2-operand-rm-sse ;
 | |
| : COMISS     ( dest src -- ) HEX: 2f f       2-operand-rm-sse ;
 | |
| : COMISD     ( dest src -- ) HEX: 2f HEX: 66 2-operand-rm-sse ;
 | |
| 
 | |
| : PSHUFB     ( dest src -- ) { HEX: 38 HEX: 00 } HEX: 66 2-operand-rm-sse ;
 | |
| : PHADDW     ( dest src -- ) { HEX: 38 HEX: 01 } HEX: 66 2-operand-rm-sse ;
 | |
| : PHADDD     ( dest src -- ) { HEX: 38 HEX: 02 } HEX: 66 2-operand-rm-sse ;
 | |
| : PHADDSW    ( dest src -- ) { HEX: 38 HEX: 03 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMADDUBSW  ( dest src -- ) { HEX: 38 HEX: 04 } HEX: 66 2-operand-rm-sse ;
 | |
| : PHSUBW     ( dest src -- ) { HEX: 38 HEX: 05 } HEX: 66 2-operand-rm-sse ;
 | |
| : PHSUBD     ( dest src -- ) { HEX: 38 HEX: 06 } HEX: 66 2-operand-rm-sse ;
 | |
| : PHSUBSW    ( dest src -- ) { HEX: 38 HEX: 07 } HEX: 66 2-operand-rm-sse ;
 | |
| : PSIGNB     ( dest src -- ) { HEX: 38 HEX: 08 } HEX: 66 2-operand-rm-sse ;
 | |
| : PSIGNW     ( dest src -- ) { HEX: 38 HEX: 09 } HEX: 66 2-operand-rm-sse ;
 | |
| : PSIGND     ( dest src -- ) { HEX: 38 HEX: 0a } HEX: 66 2-operand-rm-sse ;
 | |
| : PMULHRSW   ( dest src -- ) { HEX: 38 HEX: 0b } HEX: 66 2-operand-rm-sse ;
 | |
| : PBLENDVB   ( dest src -- ) { HEX: 38 HEX: 10 } HEX: 66 2-operand-rm-sse ;
 | |
| : BLENDVPS   ( dest src -- ) { HEX: 38 HEX: 14 } HEX: 66 2-operand-rm-sse ;
 | |
| : BLENDVPD   ( dest src -- ) { HEX: 38 HEX: 15 } HEX: 66 2-operand-rm-sse ;
 | |
| : PTEST      ( dest src -- ) { HEX: 38 HEX: 17 } HEX: 66 2-operand-rm-sse ;
 | |
| : PABSB      ( dest src -- ) { HEX: 38 HEX: 1c } HEX: 66 2-operand-rm-sse ;
 | |
| : PABSW      ( dest src -- ) { HEX: 38 HEX: 1d } HEX: 66 2-operand-rm-sse ;
 | |
| : PABSD      ( dest src -- ) { HEX: 38 HEX: 1e } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVSXBW   ( dest src -- ) { HEX: 38 HEX: 20 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVSXBD   ( dest src -- ) { HEX: 38 HEX: 21 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVSXBQ   ( dest src -- ) { HEX: 38 HEX: 22 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVSXWD   ( dest src -- ) { HEX: 38 HEX: 23 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVSXWQ   ( dest src -- ) { HEX: 38 HEX: 24 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVSXDQ   ( dest src -- ) { HEX: 38 HEX: 25 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMULDQ     ( dest src -- ) { HEX: 38 HEX: 28 } HEX: 66 2-operand-rm-sse ;
 | |
| : PCMPEQQ    ( dest src -- ) { HEX: 38 HEX: 29 } HEX: 66 2-operand-rm-sse ;
 | |
| : MOVNTDQA   ( dest src -- ) { HEX: 38 HEX: 2a } HEX: 66 2-operand-rm-sse ;
 | |
| : PACKUSDW   ( dest src -- ) { HEX: 38 HEX: 2b } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVZXBW   ( dest src -- ) { HEX: 38 HEX: 30 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVZXBD   ( dest src -- ) { HEX: 38 HEX: 31 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVZXBQ   ( dest src -- ) { HEX: 38 HEX: 32 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVZXWD   ( dest src -- ) { HEX: 38 HEX: 33 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVZXWQ   ( dest src -- ) { HEX: 38 HEX: 34 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVZXDQ   ( dest src -- ) { HEX: 38 HEX: 35 } HEX: 66 2-operand-rm-sse ;
 | |
| : PCMPGTQ    ( dest src -- ) { HEX: 38 HEX: 37 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMINSB     ( dest src -- ) { HEX: 38 HEX: 38 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMINSD     ( dest src -- ) { HEX: 38 HEX: 39 } HEX: 66 2-operand-rm-sse ;
 | |
| : PMINUW     ( dest src -- ) { HEX: 38 HEX: 3a } HEX: 66 2-operand-rm-sse ;
 | |
| : PMINUD     ( dest src -- ) { HEX: 38 HEX: 3b } HEX: 66 2-operand-rm-sse ;
 | |
| : PMAXSB     ( dest src -- ) { HEX: 38 HEX: 3c } HEX: 66 2-operand-rm-sse ;
 | |
| : PMAXSD     ( dest src -- ) { HEX: 38 HEX: 3d } HEX: 66 2-operand-rm-sse ;
 | |
| : PMAXUW     ( dest src -- ) { HEX: 38 HEX: 3e } HEX: 66 2-operand-rm-sse ;
 | |
| : PMAXUD     ( dest src -- ) { HEX: 38 HEX: 3f } HEX: 66 2-operand-rm-sse ;
 | |
| : PMULLD     ( dest src -- ) { HEX: 38 HEX: 40 } HEX: 66 2-operand-rm-sse ;
 | |
| : PHMINPOSUW ( dest src -- ) { HEX: 38 HEX: 41 } HEX: 66 2-operand-rm-sse ;
 | |
| : CRC32B     ( dest src -- ) { HEX: 38 HEX: f0 } HEX: f2 2-operand-rm-sse ;
 | |
| : CRC32      ( dest src -- ) { HEX: 38 HEX: f1 } HEX: f2 2-operand-rm-sse ;
 | |
| 
 | |
| : ROUNDPS    ( dest src imm -- ) { HEX: 3a HEX: 08 } HEX: 66 3-operand-rm-sse ;
 | |
| : ROUNDPD    ( dest src imm -- ) { HEX: 3a HEX: 09 } HEX: 66 3-operand-rm-sse ;
 | |
| : ROUNDSS    ( dest src imm -- ) { HEX: 3a HEX: 0a } HEX: 66 3-operand-rm-sse ;
 | |
| : ROUNDSD    ( dest src imm -- ) { HEX: 3a HEX: 0b } HEX: 66 3-operand-rm-sse ;
 | |
| : BLENDPS    ( dest src imm -- ) { HEX: 3a HEX: 0c } HEX: 66 3-operand-rm-sse ;
 | |
| : BLENDPD    ( dest src imm -- ) { HEX: 3a HEX: 0d } HEX: 66 3-operand-rm-sse ;
 | |
| : PBLENDW    ( dest src imm -- ) { HEX: 3a HEX: 0e } HEX: 66 3-operand-rm-sse ;
 | |
| : PALIGNR    ( dest src imm -- ) { HEX: 3a HEX: 0f } HEX: 66 3-operand-rm-sse ;
 | |
| 
 | |
| : PEXTRB     ( dest src imm -- ) { HEX: 3a HEX: 14 } HEX: 66 3-operand-mr-sse ;
 | |
| 
 | |
| <PRIVATE
 | |
| : (PEXTRW-sse1) ( dest src imm -- ) HEX: c5 HEX: 66 3-operand-rm-sse ;
 | |
| : (PEXTRW-sse4) ( dest src imm -- ) { HEX: 3a HEX: 15 } HEX: 66 3-operand-mr-sse ;
 | |
| PRIVATE>
 | |
| 
 | |
| : PEXTRW     ( dest src imm -- ) pick indirect? [ (PEXTRW-sse4) ] [ (PEXTRW-sse1) ] if ;
 | |
| : PEXTRD     ( dest src imm -- ) { HEX: 3a HEX: 16 } HEX: 66 3-operand-mr-sse ;
 | |
| ALIAS: PEXTRQ PEXTRD
 | |
| : EXTRACTPS  ( dest src imm -- ) { HEX: 3a HEX: 17 } HEX: 66 3-operand-mr-sse ;
 | |
| 
 | |
| : PINSRB     ( dest src imm -- ) { HEX: 3a HEX: 20 } HEX: 66 3-operand-rm-sse ;
 | |
| : INSERTPS   ( dest src imm -- ) { HEX: 3a HEX: 21 } HEX: 66 3-operand-rm-sse ;
 | |
| : PINSRD     ( dest src imm -- ) { HEX: 3a HEX: 22 } HEX: 66 3-operand-rm-sse ;
 | |
| ALIAS: PINSRQ PINSRD
 | |
| : DPPS       ( dest src imm -- ) { HEX: 3a HEX: 40 } HEX: 66 3-operand-rm-sse ;
 | |
| : DPPD       ( dest src imm -- ) { HEX: 3a HEX: 41 } HEX: 66 3-operand-rm-sse ;
 | |
| : MPSADBW    ( dest src imm -- ) { HEX: 3a HEX: 42 } HEX: 66 3-operand-rm-sse ;
 | |
| : PCMPESTRM  ( dest src imm -- ) { HEX: 3a HEX: 60 } HEX: 66 3-operand-rm-sse ;
 | |
| : PCMPESTRI  ( dest src imm -- ) { HEX: 3a HEX: 61 } HEX: 66 3-operand-rm-sse ;
 | |
| : PCMPISTRM  ( dest src imm -- ) { HEX: 3a HEX: 62 } HEX: 66 3-operand-rm-sse ;
 | |
| : PCMPISTRI  ( dest src imm -- ) { HEX: 3a HEX: 63 } HEX: 66 3-operand-rm-sse ;
 | |
| 
 | |
| : MOVMSKPS   ( dest src -- ) HEX: 50 f       2-operand-int/sse ;
 | |
| : MOVMSKPD   ( dest src -- ) HEX: 50 HEX: 66 2-operand-int/sse ;
 | |
| : SQRTPS     ( dest src -- ) HEX: 51 f       2-operand-rm-sse ;
 | |
| : SQRTPD     ( dest src -- ) HEX: 51 HEX: 66 2-operand-rm-sse ;
 | |
| : SQRTSD     ( dest src -- ) HEX: 51 HEX: f2 2-operand-rm-sse ;
 | |
| : SQRTSS     ( dest src -- ) HEX: 51 HEX: f3 2-operand-rm-sse ;
 | |
| : RSQRTPS    ( dest src -- ) HEX: 52 f       2-operand-rm-sse ;
 | |
| : RSQRTSS    ( dest src -- ) HEX: 52 HEX: f3 2-operand-rm-sse ;
 | |
| : RCPPS      ( dest src -- ) HEX: 53 f       2-operand-rm-sse ;
 | |
| : RCPSS      ( dest src -- ) HEX: 53 HEX: f3 2-operand-rm-sse ;
 | |
| : ANDPS      ( dest src -- ) HEX: 54 f       2-operand-rm-sse ;
 | |
| : ANDPD      ( dest src -- ) HEX: 54 HEX: 66 2-operand-rm-sse ;
 | |
| : ANDNPS     ( dest src -- ) HEX: 55 f       2-operand-rm-sse ;
 | |
| : ANDNPD     ( dest src -- ) HEX: 55 HEX: 66 2-operand-rm-sse ;
 | |
| : ORPS       ( dest src -- ) HEX: 56 f       2-operand-rm-sse ;
 | |
| : ORPD       ( dest src -- ) HEX: 56 HEX: 66 2-operand-rm-sse ;
 | |
| : XORPS      ( dest src -- ) HEX: 57 f       2-operand-rm-sse ;
 | |
| : XORPD      ( dest src -- ) HEX: 57 HEX: 66 2-operand-rm-sse ;
 | |
| : ADDPS      ( dest src -- ) HEX: 58 f       2-operand-rm-sse ;
 | |
| : ADDPD      ( dest src -- ) HEX: 58 HEX: 66 2-operand-rm-sse ;
 | |
| : ADDSD      ( dest src -- ) HEX: 58 HEX: f2 2-operand-rm-sse ;
 | |
| : ADDSS      ( dest src -- ) HEX: 58 HEX: f3 2-operand-rm-sse ;
 | |
| : MULPS      ( dest src -- ) HEX: 59 f       2-operand-rm-sse ;
 | |
| : MULPD      ( dest src -- ) HEX: 59 HEX: 66 2-operand-rm-sse ;
 | |
| : MULSD      ( dest src -- ) HEX: 59 HEX: f2 2-operand-rm-sse ;
 | |
| : MULSS      ( dest src -- ) HEX: 59 HEX: f3 2-operand-rm-sse ;
 | |
| : CVTPS2PD   ( dest src -- ) HEX: 5a f       2-operand-rm-sse ;
 | |
| : CVTPD2PS   ( dest src -- ) HEX: 5a HEX: 66 2-operand-rm-sse ;
 | |
| : CVTSD2SS   ( dest src -- ) HEX: 5a HEX: f2 2-operand-rm-sse ;
 | |
| : CVTSS2SD   ( dest src -- ) HEX: 5a HEX: f3 2-operand-rm-sse ;
 | |
| : CVTDQ2PS   ( dest src -- ) HEX: 5b f       2-operand-rm-sse ;
 | |
| : CVTPS2DQ   ( dest src -- ) HEX: 5b HEX: 66 2-operand-rm-sse ;
 | |
| : CVTTPS2DQ  ( dest src -- ) HEX: 5b HEX: f3 2-operand-rm-sse ;
 | |
| : SUBPS      ( dest src -- ) HEX: 5c f       2-operand-rm-sse ;
 | |
| : SUBPD      ( dest src -- ) HEX: 5c HEX: 66 2-operand-rm-sse ;
 | |
| : SUBSD      ( dest src -- ) HEX: 5c HEX: f2 2-operand-rm-sse ;
 | |
| : SUBSS      ( dest src -- ) HEX: 5c HEX: f3 2-operand-rm-sse ;
 | |
| : MINPS      ( dest src -- ) HEX: 5d f       2-operand-rm-sse ;
 | |
| : MINPD      ( dest src -- ) HEX: 5d HEX: 66 2-operand-rm-sse ;
 | |
| : MINSD      ( dest src -- ) HEX: 5d HEX: f2 2-operand-rm-sse ;
 | |
| : MINSS      ( dest src -- ) HEX: 5d HEX: f3 2-operand-rm-sse ;
 | |
| : DIVPS      ( dest src -- ) HEX: 5e f       2-operand-rm-sse ;
 | |
| : DIVPD      ( dest src -- ) HEX: 5e HEX: 66 2-operand-rm-sse ;
 | |
| : DIVSD      ( dest src -- ) HEX: 5e HEX: f2 2-operand-rm-sse ;
 | |
| : DIVSS      ( dest src -- ) HEX: 5e HEX: f3 2-operand-rm-sse ;
 | |
| : MAXPS      ( dest src -- ) HEX: 5f f       2-operand-rm-sse ;
 | |
| : MAXPD      ( dest src -- ) HEX: 5f HEX: 66 2-operand-rm-sse ;
 | |
| : MAXSD      ( dest src -- ) HEX: 5f HEX: f2 2-operand-rm-sse ;
 | |
| : MAXSS      ( dest src -- ) HEX: 5f HEX: f3 2-operand-rm-sse ;
 | |
| : PUNPCKLBW  ( dest src -- ) HEX: 60 HEX: 66 2-operand-rm-sse ;
 | |
| : PUNPCKLWD  ( dest src -- ) HEX: 61 HEX: 66 2-operand-rm-sse ;
 | |
| : PUNPCKLDQ  ( dest src -- ) HEX: 62 HEX: 66 2-operand-rm-sse ;
 | |
| : PACKSSWB   ( dest src -- ) HEX: 63 HEX: 66 2-operand-rm-sse ;
 | |
| : PCMPGTB    ( dest src -- ) HEX: 64 HEX: 66 2-operand-rm-sse ;
 | |
| : PCMPGTW    ( dest src -- ) HEX: 65 HEX: 66 2-operand-rm-sse ;
 | |
| : PCMPGTD    ( dest src -- ) HEX: 66 HEX: 66 2-operand-rm-sse ;
 | |
| : PACKUSWB   ( dest src -- ) HEX: 67 HEX: 66 2-operand-rm-sse ;
 | |
| : PUNPCKHBW  ( dest src -- ) HEX: 68 HEX: 66 2-operand-rm-sse ;
 | |
| : PUNPCKHWD  ( dest src -- ) HEX: 69 HEX: 66 2-operand-rm-sse ;
 | |
| : PUNPCKHDQ  ( dest src -- ) HEX: 6a HEX: 66 2-operand-rm-sse ;
 | |
| : PACKSSDW   ( dest src -- ) HEX: 6b HEX: 66 2-operand-rm-sse ;
 | |
| : PUNPCKLQDQ ( dest src -- ) HEX: 6c HEX: 66 2-operand-rm-sse ;
 | |
| : PUNPCKHQDQ ( dest src -- ) HEX: 6d HEX: 66 2-operand-rm-sse ;
 | |
| 
 | |
| : MOVD       ( dest src -- ) { HEX: 6e HEX: 7e } HEX: 66 2-operand-rm-mr-sse ;
 | |
| : MOVDQA     ( dest src -- ) { HEX: 6f HEX: 7f } HEX: 66 2-operand-rm-mr-sse ;
 | |
| : MOVDQU     ( dest src -- ) { HEX: 6f HEX: 7f } HEX: f3 2-operand-rm-mr-sse ;
 | |
| 
 | |
| : MOVQ       ( dest src -- )
 | |
|     { { HEX: 7e HEX: f3 } { HEX: d6 HEX: 66 } } 2-operand-rm-mr-sse* ;
 | |
| 
 | |
| <PRIVATE
 | |
| 
 | |
| : 2shuffler ( indexes/mask -- mask )
 | |
|     dup integer? [ first2 { 1 0 } bitfield ] unless ;
 | |
| : 4shuffler ( indexes/mask -- mask )
 | |
|     dup integer? [ first4 { 6 4 2 0 } bitfield ] unless ;
 | |
| 
 | |
| PRIVATE>
 | |
| 
 | |
| : PSHUFD     ( dest src imm -- ) 4shuffler HEX: 70 HEX: 66 3-operand-rm-sse ;
 | |
| : PSHUFLW    ( dest src imm -- ) 4shuffler HEX: 70 HEX: f2 3-operand-rm-sse ;
 | |
| : PSHUFHW    ( dest src imm -- ) 4shuffler HEX: 70 HEX: f3 3-operand-rm-sse ;
 | |
| 
 | |
| <PRIVATE
 | |
| 
 | |
| : (PSRLW-imm) ( dest imm -- ) BIN: 010 HEX: 71 HEX: 66 2-operand-sse-shift ;
 | |
| : (PSRAW-imm) ( dest imm -- ) BIN: 100 HEX: 71 HEX: 66 2-operand-sse-shift ;
 | |
| : (PSLLW-imm) ( dest imm -- ) BIN: 110 HEX: 71 HEX: 66 2-operand-sse-shift ;
 | |
| : (PSRLD-imm) ( dest imm -- ) BIN: 010 HEX: 72 HEX: 66 2-operand-sse-shift ;
 | |
| : (PSRAD-imm) ( dest imm -- ) BIN: 100 HEX: 72 HEX: 66 2-operand-sse-shift ;
 | |
| : (PSLLD-imm) ( dest imm -- ) BIN: 110 HEX: 72 HEX: 66 2-operand-sse-shift ;
 | |
| : (PSRLQ-imm) ( dest imm -- ) BIN: 010 HEX: 73 HEX: 66 2-operand-sse-shift ;
 | |
| : (PSLLQ-imm) ( dest imm -- ) BIN: 110 HEX: 73 HEX: 66 2-operand-sse-shift ;
 | |
| 
 | |
| : (PSRLW-reg) ( dest src -- ) HEX: d1 HEX: 66 2-operand-rm-sse ;
 | |
| : (PSRLD-reg) ( dest src -- ) HEX: d2 HEX: 66 2-operand-rm-sse ;
 | |
| : (PSRLQ-reg) ( dest src -- ) HEX: d3 HEX: 66 2-operand-rm-sse ;
 | |
| : (PSRAW-reg) ( dest src -- ) HEX: e1 HEX: 66 2-operand-rm-sse ;
 | |
| : (PSRAD-reg) ( dest src -- ) HEX: e2 HEX: 66 2-operand-rm-sse ;
 | |
| : (PSLLW-reg) ( dest src -- ) HEX: f1 HEX: 66 2-operand-rm-sse ;
 | |
| : (PSLLD-reg) ( dest src -- ) HEX: f2 HEX: 66 2-operand-rm-sse ;
 | |
| : (PSLLQ-reg) ( dest src -- ) HEX: f3 HEX: 66 2-operand-rm-sse ;
 | |
| 
 | |
| PRIVATE>
 | |
| 
 | |
| : PSRLW ( dest src -- ) dup integer? [ (PSRLW-imm) ] [ (PSRLW-reg) ] if ;
 | |
| : PSRAW ( dest src -- ) dup integer? [ (PSRAW-imm) ] [ (PSRAW-reg) ] if ;
 | |
| : PSLLW ( dest src -- ) dup integer? [ (PSLLW-imm) ] [ (PSLLW-reg) ] if ;
 | |
| : PSRLD ( dest src -- ) dup integer? [ (PSRLD-imm) ] [ (PSRLD-reg) ] if ;
 | |
| : PSRAD ( dest src -- ) dup integer? [ (PSRAD-imm) ] [ (PSRAD-reg) ] if ;
 | |
| : PSLLD ( dest src -- ) dup integer? [ (PSLLD-imm) ] [ (PSLLD-reg) ] if ;
 | |
| : PSRLQ ( dest src -- ) dup integer? [ (PSRLQ-imm) ] [ (PSRLQ-reg) ] if ;
 | |
| : PSLLQ ( dest src -- ) dup integer? [ (PSLLQ-imm) ] [ (PSLLQ-reg) ] if ;
 | |
| 
 | |
| : PSRLDQ     ( dest imm -- ) BIN: 011 HEX: 73 HEX: 66 2-operand-sse-shift ;
 | |
| : PSLLDQ     ( dest imm -- ) BIN: 111 HEX: 73 HEX: 66 2-operand-sse-shift ;
 | |
| 
 | |
| : PCMPEQB    ( dest src -- ) HEX: 74 HEX: 66 2-operand-rm-sse ;
 | |
| : PCMPEQW    ( dest src -- ) HEX: 75 HEX: 66 2-operand-rm-sse ;
 | |
| : PCMPEQD    ( dest src -- ) HEX: 76 HEX: 66 2-operand-rm-sse ;
 | |
| : HADDPD     ( dest src -- ) HEX: 7c HEX: 66 2-operand-rm-sse ;
 | |
| : HADDPS     ( dest src -- ) HEX: 7c HEX: f2 2-operand-rm-sse ;
 | |
| : HSUBPD     ( dest src -- ) HEX: 7d HEX: 66 2-operand-rm-sse ;
 | |
| : HSUBPS     ( dest src -- ) HEX: 7d HEX: f2 2-operand-rm-sse ;
 | |
| 
 | |
| : FXSAVE     ( dest -- ) { BIN: 000 f { HEX: 0f HEX: ae } } 1-operand ;
 | |
| : FXRSTOR    ( src -- )  { BIN: 001 f { HEX: 0f HEX: ae } } 1-operand ;
 | |
| : LDMXCSR    ( src -- )  { BIN: 010 f { HEX: 0f HEX: ae } } 1-operand ;
 | |
| : STMXCSR    ( dest -- ) { BIN: 011 f { HEX: 0f HEX: ae } } 1-operand ;
 | |
| : LFENCE     ( -- ) HEX: 0f , HEX: ae , OCT: 350 , ;
 | |
| : MFENCE     ( -- ) HEX: 0f , HEX: ae , OCT: 360 , ;
 | |
| : SFENCE     ( -- ) HEX: 0f , HEX: ae , OCT: 370 , ;
 | |
| : CLFLUSH    ( dest -- ) { BIN: 111 f { HEX: 0f HEX: ae } } 1-operand ;
 | |
| 
 | |
| : POPCNT     ( dest src -- ) HEX: b8 HEX: f3 2-operand-rm-sse ;
 | |
| 
 | |
| : CMPEQPS    ( dest src -- ) 0 HEX: c2 f       2-operand-sse-cmp ;
 | |
| : CMPLTPS    ( dest src -- ) 1 HEX: c2 f       2-operand-sse-cmp ;
 | |
| : CMPLEPS    ( dest src -- ) 2 HEX: c2 f       2-operand-sse-cmp ;
 | |
| : CMPUNORDPS ( dest src -- ) 3 HEX: c2 f       2-operand-sse-cmp ;
 | |
| : CMPNEQPS   ( dest src -- ) 4 HEX: c2 f       2-operand-sse-cmp ;
 | |
| : CMPNLTPS   ( dest src -- ) 5 HEX: c2 f       2-operand-sse-cmp ;
 | |
| : CMPNLEPS   ( dest src -- ) 6 HEX: c2 f       2-operand-sse-cmp ;
 | |
| : CMPORDPS   ( dest src -- ) 7 HEX: c2 f       2-operand-sse-cmp ;
 | |
| 
 | |
| : CMPEQPD    ( dest src -- ) 0 HEX: c2 HEX: 66 2-operand-sse-cmp ;
 | |
| : CMPLTPD    ( dest src -- ) 1 HEX: c2 HEX: 66 2-operand-sse-cmp ;
 | |
| : CMPLEPD    ( dest src -- ) 2 HEX: c2 HEX: 66 2-operand-sse-cmp ;
 | |
| : CMPUNORDPD ( dest src -- ) 3 HEX: c2 HEX: 66 2-operand-sse-cmp ;
 | |
| : CMPNEQPD   ( dest src -- ) 4 HEX: c2 HEX: 66 2-operand-sse-cmp ;
 | |
| : CMPNLTPD   ( dest src -- ) 5 HEX: c2 HEX: 66 2-operand-sse-cmp ;
 | |
| : CMPNLEPD   ( dest src -- ) 6 HEX: c2 HEX: 66 2-operand-sse-cmp ;
 | |
| : CMPORDPD   ( dest src -- ) 7 HEX: c2 HEX: 66 2-operand-sse-cmp ;
 | |
| 
 | |
| : CMPEQSD    ( dest src -- ) 0 HEX: c2 HEX: f2 2-operand-sse-cmp ;
 | |
| : CMPLTSD    ( dest src -- ) 1 HEX: c2 HEX: f2 2-operand-sse-cmp ;
 | |
| : CMPLESD    ( dest src -- ) 2 HEX: c2 HEX: f2 2-operand-sse-cmp ;
 | |
| : CMPUNORDSD ( dest src -- ) 3 HEX: c2 HEX: f2 2-operand-sse-cmp ;
 | |
| : CMPNEQSD   ( dest src -- ) 4 HEX: c2 HEX: f2 2-operand-sse-cmp ;
 | |
| : CMPNLTSD   ( dest src -- ) 5 HEX: c2 HEX: f2 2-operand-sse-cmp ;
 | |
| : CMPNLESD   ( dest src -- ) 6 HEX: c2 HEX: f2 2-operand-sse-cmp ;
 | |
| : CMPORDSD   ( dest src -- ) 7 HEX: c2 HEX: f2 2-operand-sse-cmp ;
 | |
| 
 | |
| : CMPEQSS    ( dest src -- ) 0 HEX: c2 HEX: f3 2-operand-sse-cmp ;
 | |
| : CMPLTSS    ( dest src -- ) 1 HEX: c2 HEX: f3 2-operand-sse-cmp ;
 | |
| : CMPLESS    ( dest src -- ) 2 HEX: c2 HEX: f3 2-operand-sse-cmp ;
 | |
| : CMPUNORDSS ( dest src -- ) 3 HEX: c2 HEX: f3 2-operand-sse-cmp ;
 | |
| : CMPNEQSS   ( dest src -- ) 4 HEX: c2 HEX: f3 2-operand-sse-cmp ;
 | |
| : CMPNLTSS   ( dest src -- ) 5 HEX: c2 HEX: f3 2-operand-sse-cmp ;
 | |
| : CMPNLESS   ( dest src -- ) 6 HEX: c2 HEX: f3 2-operand-sse-cmp ;
 | |
| : CMPORDSS   ( dest src -- ) 7 HEX: c2 HEX: f3 2-operand-sse-cmp ;
 | |
| 
 | |
| : MOVNTI     ( dest src -- ) swap { HEX: 0f HEX: c3 } (2-operand) ;
 | |
| 
 | |
| : PINSRW     ( dest src imm -- ) HEX: c4 HEX: 66 3-operand-rm-sse ;
 | |
| : SHUFPS     ( dest src imm -- ) 4shuffler HEX: c6 f       3-operand-rm-sse ;
 | |
| : SHUFPD     ( dest src imm -- ) 2shuffler HEX: c6 HEX: 66 3-operand-rm-sse ;
 | |
| 
 | |
| : ADDSUBPD   ( dest src -- ) HEX: d0 HEX: 66 2-operand-rm-sse ;
 | |
| : ADDSUBPS   ( dest src -- ) HEX: d0 HEX: f2 2-operand-rm-sse ;
 | |
| : PADDQ      ( dest src -- ) HEX: d4 HEX: 66 2-operand-rm-sse ;
 | |
| : PMULLW     ( dest src -- ) HEX: d5 HEX: 66 2-operand-rm-sse ;
 | |
| : PMOVMSKB   ( dest src -- ) HEX: d7 HEX: 66 2-operand-rm-sse ;
 | |
| : PSUBUSB    ( dest src -- ) HEX: d8 HEX: 66 2-operand-rm-sse ;
 | |
| : PSUBUSW    ( dest src -- ) HEX: d9 HEX: 66 2-operand-rm-sse ;
 | |
| : PMINUB     ( dest src -- ) HEX: da HEX: 66 2-operand-rm-sse ;
 | |
| : PAND       ( dest src -- ) HEX: db HEX: 66 2-operand-rm-sse ;
 | |
| : PADDUSB    ( dest src -- ) HEX: dc HEX: 66 2-operand-rm-sse ;
 | |
| : PADDUSW    ( dest src -- ) HEX: dd HEX: 66 2-operand-rm-sse ;
 | |
| : PMAXUB     ( dest src -- ) HEX: de HEX: 66 2-operand-rm-sse ;
 | |
| : PANDN      ( dest src -- ) HEX: df HEX: 66 2-operand-rm-sse ;
 | |
| : PAVGB      ( dest src -- ) HEX: e0 HEX: 66 2-operand-rm-sse ;
 | |
| : PAVGW      ( dest src -- ) HEX: e3 HEX: 66 2-operand-rm-sse ;
 | |
| : PMULHUW    ( dest src -- ) HEX: e4 HEX: 66 2-operand-rm-sse ;
 | |
| : PMULHW     ( dest src -- ) HEX: e5 HEX: 66 2-operand-rm-sse ;
 | |
| : CVTTPD2DQ  ( dest src -- ) HEX: e6 HEX: 66 2-operand-rm-sse ;
 | |
| : CVTPD2DQ   ( dest src -- ) HEX: e6 HEX: f2 2-operand-rm-sse ;
 | |
| : CVTDQ2PD   ( dest src -- ) HEX: e6 HEX: f3 2-operand-rm-sse ;
 | |
| 
 | |
| : MOVNTDQ    ( dest src -- ) HEX: e7 HEX: 66 2-operand-mr-sse ;
 | |
| 
 | |
| : PSUBSB     ( dest src -- ) HEX: e8 HEX: 66 2-operand-rm-sse ;
 | |
| : PSUBSW     ( dest src -- ) HEX: e9 HEX: 66 2-operand-rm-sse ;
 | |
| : PMINSW     ( dest src -- ) HEX: ea HEX: 66 2-operand-rm-sse ;
 | |
| : POR        ( dest src -- ) HEX: eb HEX: 66 2-operand-rm-sse ;
 | |
| : PADDSB     ( dest src -- ) HEX: ec HEX: 66 2-operand-rm-sse ;
 | |
| : PADDSW     ( dest src -- ) HEX: ed HEX: 66 2-operand-rm-sse ;
 | |
| : PMAXSW     ( dest src -- ) HEX: ee HEX: 66 2-operand-rm-sse ;
 | |
| : PXOR       ( dest src -- ) HEX: ef HEX: 66 2-operand-rm-sse ;
 | |
| : LDDQU      ( dest src -- ) HEX: f0 HEX: f2 2-operand-rm-sse ;
 | |
| : PMULUDQ    ( dest src -- ) HEX: f4 HEX: 66 2-operand-rm-sse ;
 | |
| : PMADDWD    ( dest src -- ) HEX: f5 HEX: 66 2-operand-rm-sse ;
 | |
| : PSADBW     ( dest src -- ) HEX: f6 HEX: 66 2-operand-rm-sse ;
 | |
| : MASKMOVDQU ( dest src -- ) HEX: f7 HEX: 66 2-operand-rm-sse ;
 | |
| : PSUBB      ( dest src -- ) HEX: f8 HEX: 66 2-operand-rm-sse ;
 | |
| : PSUBW      ( dest src -- ) HEX: f9 HEX: 66 2-operand-rm-sse ;
 | |
| : PSUBD      ( dest src -- ) HEX: fa HEX: 66 2-operand-rm-sse ;
 | |
| : PSUBQ      ( dest src -- ) HEX: fb HEX: 66 2-operand-rm-sse ;
 | |
| : PADDB      ( dest src -- ) HEX: fc HEX: 66 2-operand-rm-sse ;
 | |
| : PADDW      ( dest src -- ) HEX: fd HEX: 66 2-operand-rm-sse ;
 | |
| : PADDD      ( dest src -- ) HEX: fe HEX: 66 2-operand-rm-sse ;
 | |
| 
 | |
| ! x86-64 branch prediction hints
 | |
| 
 | |
| : HWNT ( -- ) HEX: 2e , ; ! Hint branch Weakly Not Taken
 | |
| : HST  ( -- ) HEX: 3e , ; ! Hint branch Strongly Taken
 |