[BACK]Return to addmul_1.S CVS log [TXT][DIR] Up to [local] / OpenXM_contrib / gmp / mpn / sparc32 / v8

Annotation of OpenXM_contrib/gmp/mpn/sparc32/v8/addmul_1.S, Revision 1.1

1.1     ! maekawa     1: ! SPARC v8 __mpn_addmul_1 -- Multiply a limb vector with a limb and
        !             2: ! add the result to a second limb vector.
        !             3:
        !             4: ! Copyright (C) 1992, 1993, 1994, 1995 Free Software Foundation, Inc.
        !             5:
        !             6: ! This file is part of the GNU MP Library.
        !             7:
        !             8: ! The GNU MP Library is free software; you can redistribute it and/or modify
        !             9: ! it under the terms of the GNU Library General Public License as published by
        !            10: ! the Free Software Foundation; either version 2 of the License, or (at your
        !            11: ! option) any later version.
        !            12:
        !            13: ! The GNU MP Library is distributed in the hope that it will be useful, but
        !            14: ! WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
        !            15: ! or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Library General Public
        !            16: ! License for more details.
        !            17:
        !            18: ! You should have received a copy of the GNU Library General Public License
        !            19: ! along with the GNU MP Library; see the file COPYING.LIB.  If not, write to
        !            20: ! the Free Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
        !            21: ! MA 02111-1307, USA.
        !            22:
        !            23:
        !            24: ! INPUT PARAMETERS
        !            25: ! res_ptr      o0
        !            26: ! s1_ptr       o1
        !            27: ! size         o2
        !            28: ! s2_limb      o3
        !            29:
        !            30: #include "sysdep.h"
        !            31:
        !            32: .text
        !            33:        .align 4
        !            34:        .global C_SYMBOL_NAME(__mpn_addmul_1)
        !            35: C_SYMBOL_NAME(__mpn_addmul_1):
        !            36:        orcc    %g0,%g0,%g2
        !            37:        ld      [%o1+0],%o4     ! 1
        !            38:
        !            39:        sll     %o2,4,%g1
        !            40:        and     %g1,(4-1)<<4,%g1
        !            41: #if PIC
        !            42:        mov     %o7,%g4                 ! Save return address register
        !            43:        call    1f
        !            44:        add     %o7,LL-1f,%g3
        !            45: 1:     mov     %g4,%o7                 ! Restore return address register
        !            46: #else
        !            47:        sethi   %hi(LL),%g3
        !            48:        or      %g3,%lo(LL),%g3
        !            49: #endif
        !            50:        jmp     %g3+%g1
        !            51:        nop
        !            52: LL:
        !            53: LL00:  add     %o0,-4,%o0
        !            54:        b       Loop00          /* 4, 8, 12, ... */
        !            55:        add     %o1,-4,%o1
        !            56:        nop
        !            57: LL01:  b       Loop01          /* 1, 5, 9, ... */
        !            58:        nop
        !            59:        nop
        !            60:        nop
        !            61: LL10:  add     %o0,-12,%o0     /* 2, 6, 10, ... */
        !            62:        b       Loop10
        !            63:        add     %o1,4,%o1
        !            64:        nop
        !            65: LL11:  add     %o0,-8,%o0      /* 3, 7, 11, ... */
        !            66:        b       Loop11
        !            67:        add     %o1,-8,%o1
        !            68:        nop
        !            69:
        !            70: 1:     addcc   %g3,%g2,%g3     ! 1
        !            71:        ld      [%o1+4],%o4     ! 2
        !            72:        rd      %y,%g2          ! 1
        !            73:        addx    %g0,%g2,%g2
        !            74:        ld      [%o0+0],%g1     ! 2
        !            75:        addcc   %g1,%g3,%g3
        !            76:        st      %g3,[%o0+0]     ! 1
        !            77: Loop00:        umul    %o4,%o3,%g3     ! 2
        !            78:        ld      [%o0+4],%g1     ! 2
        !            79:        addxcc  %g3,%g2,%g3     ! 2
        !            80:        ld      [%o1+8],%o4     ! 3
        !            81:        rd      %y,%g2          ! 2
        !            82:        addx    %g0,%g2,%g2
        !            83:        nop
        !            84:        addcc   %g1,%g3,%g3
        !            85:        st      %g3,[%o0+4]     ! 2
        !            86: Loop11:        umul    %o4,%o3,%g3     ! 3
        !            87:        addxcc  %g3,%g2,%g3     ! 3
        !            88:        ld      [%o1+12],%o4    ! 4
        !            89:        rd      %y,%g2          ! 3
        !            90:        add     %o1,16,%o1
        !            91:        addx    %g0,%g2,%g2
        !            92:        ld      [%o0+8],%g1     ! 2
        !            93:        addcc   %g1,%g3,%g3
        !            94:        st      %g3,[%o0+8]     ! 3
        !            95: Loop10:        umul    %o4,%o3,%g3     ! 4
        !            96:        addxcc  %g3,%g2,%g3     ! 4
        !            97:        ld      [%o1+0],%o4     ! 1
        !            98:        rd      %y,%g2          ! 4
        !            99:        addx    %g0,%g2,%g2
        !           100:        ld      [%o0+12],%g1    ! 2
        !           101:        addcc   %g1,%g3,%g3
        !           102:        st      %g3,[%o0+12]    ! 4
        !           103:        add     %o0,16,%o0
        !           104:        addx    %g0,%g2,%g2
        !           105: Loop01:        addcc   %o2,-4,%o2
        !           106:        bg      1b
        !           107:        umul    %o4,%o3,%g3     ! 1
        !           108:
        !           109:        addcc   %g3,%g2,%g3     ! 4
        !           110:        rd      %y,%g2          ! 4
        !           111:        addx    %g0,%g2,%g2
        !           112:        ld      [%o0+0],%g1     ! 2
        !           113:        addcc   %g1,%g3,%g3
        !           114:        st      %g3,[%o0+0]     ! 4
        !           115:        addx    %g0,%g2,%o0
        !           116:
        !           117:        retl
        !           118:         nop
        !           119:
        !           120:
        !           121: !      umul, ld, addxcc, rd, st
        !           122:
        !           123: !      umul, ld, addxcc, rd, ld, addcc, st, addx
        !           124:

FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>