New URL for NEMO forge! http://forge.nemo-ocean.eu

Since March 2022 along with NEMO 4.2 release, the code development moved to a self-hosted GitLab.
This present forge is now archived and remained online for history.

2019WP/KERNEL-02_Storkey_Coward_IMMERSE_first_steps (diff) – NEMO

Context Navigation

Changes between Version 16 and Version 17 of 2019WP/KERNEL-02_Storkey_Coward_IMMERSE_first_steps

Timestamp:: 2019-03-04T18:50:27+01:00 (5 years ago)
Author:: acc
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

2019WP/KERNEL-02_Storkey_Coward_IMMERSE_first_steps

-                      v16
+                      v17
 {{{#!Fold title=Preview tag=h2
 [=#preview]
+[#step1 The refactoring script] \\
+[#step2 The refactoring script explained]\\
+[#step3 Notes on testing regular expressions]\\
+[#step4 Some contrived tests]\\
+[#step5 Results of real files]\\
+\\
+[#step6 Automating the tiling changes]\\
+[#step7 Results on traldf_iso.F90]\\
+[#step8 do2dfinder.pl]\\
+[#step9 do3dfinder.pl]\\
+[#step10 Sanity checks and domain_substitute.h90]\\
 Part of the reorganisation for RK3 requires the refactoring of arrays such as un, ub into a single, 4 dimensional array with a time-level dimension. It is expected that much of the work required here can be automated to the extent that it is feasible to re-apply these changes after the annual merge. Below is a working example of how this might be achieved. Perl is used to carry out the pattern matching and substitution because of its ability to match patterns extending over several lines. A random subset of source files are used in this example and serve to illustrate the successes and caveats for the method.
 …
 }}}
+'''The refactoring script'''
+[=#step1 '''The refactoring script''']
 {{{#!bash
 …
 }}}
+'''The refactoring script explained'''
+[=#step2 '''The refactoring script explained''']
 {{{#!bash
 …
 }}}
+'''Notes on testing regular expressions'''
+[=#step3 '''Notes on testing regular expressions''']
 Testing and deciphering the regular expression used in the LHS of the perl substitute command is made easier by the availability of on-line testers. below is a screenshot from regex101.com which helps illustrate and explain the regular expression used here:
 …
 [[Image(regex101_example_sm.png)]]
+''' Some contrived tests:'''
+[=#step4 ''' Some contrived tests:''']
 {{{#!f
 …
 So all changes were made correctly and even those entries which were potential pitfalls (pun and sbc_fwb) were correctly ignored. Time to try a real set:
+'''The results on the sample set of files (patch.list):'''
+[=#step5 '''The results on the sample set of files (patch.list):''']
 {{{#!diff
 …
 So far so good....
 == Automating the tiling changes
+== [=#step6 Automating the tiling changes]
 Here is a almost complete attempt at automating the loop changes. Earlier versions (now superceded) maintained the DO loop ranges as arguments to the macros. These arguments are now interptreted and converted to the binary representative form suggested by Gurvan. The logic for this is basic at present and possibly easily fooled (but works on the examples used so far). I've persisted with a two-stage conversion with a script to convert 2D loops and then a second script to convert 3D loops. This makes the scripts readable and allows easier verification. The two scripts are named `do2dfinder.pl` and `do3dfinder.pl` and are included below. Firstly here is an example of the scripts in action on the following test file:
 …
 +     END_3D
 }}}
+traldf_iso.F90 provides a more stringent test:
+[=#step7 traldf_iso.F90 provides a more stringent test:]
 {{{
    perl do2dfinder.pl TESTDO_FILES/traldf_iso.F90 > TESTDO_FILES_2D/traldf_iso.F90
 …
               ( kpass == 2 .AND. ln_traldf_blp ) ) THEN      !==  2nd   pass      (bilaplacian)  ==!
 }}}
+And finally the two scripts that achieve this. Note the logic that may need tightening at sections 5 and 6 in the first script:
+[=#step8 And finally the two scripts that achieve this. Note the logic that may need tightening at sections 5 and 6 in the first script:]
 {{{#!perl
 #cat do2dfinder.pl
 …
+}
 }}}
+and
+[=#step9 and]
 {{{#!perl
 #cat do3dfinder.pl
 …
+}
 }}}
+== [=#step10 Sanity Check]
+Introducing a form of the proposed `domain_substitute.h90` file to the final version and running through a preprocssor should recover the equivalent of the original file (barring white space changes and line concatenations). For example:
+{{{
+cat domain_substitute.h90
+#define kJs 2
+#define kIs 2
+#define kJe jpjm1
+#define kIe jpim1
+#define DO_2D_00_00 DO jj = kJs ,kJe     ; DO ji = kIs ,kIe
+#define DO_2D_10_10 DO jj = kJs-1, kJe   ; DO ji = kIs-1, kIe
+#define DO_2D_01_01 DO jj = kJs , kJe+1  ; DO ji = kIs , kIe+1
+#define DO_2D_11_11 DO jj = kJs-1, kJe+1 ; DO ji = kIs-1, kIe+1
+#define DO_3D_00_00(ks,ke) DO jk = ks, ke ; DO_2D_00_00
+#define DO_3D_10_10(ks,ke) DO jk = ks, ke ; DO_2D_10_10
+#define DO_3D_01_01(ks,ke) DO jk = ks, ke ; DO_2D_01_01
+#define DO_3D_11_11(ks,ke) DO jk = ks, ke ; DO_2D_11_11
+#define END_2D END DO ; END DO
+#define END_3D END DO ; END DO ; END DO
+ed - TESTDO_FILES_3D/traldf_iso.F90 << EOF
+> 0a
+> #include "domain_substute.h90"
+> .
+> w
+> q
+> EOF
+gfortran -E -P TESTDO_FILES_3D/traldf_iso.F90 > SANITY/traldf_iso.f90
+diff -u TESTDO_FILES/traldf_iso.F90 SANITY/traldf_iso.f90 > sanity.patch
+}}}
+And this does appear to be the case:
+{{{#!diff
+--- TESTDO_FILES/traldf_iso.F90 2019-03-04 12:59:44.000000000 +0000
++++ SANITY/traldf_iso.f90       2019-03-04 17:17:32.000000000 +0000
+@@ -1,3 +1,6 @@
++
++
++
+ MODULE traldf_iso
+    !!======================================================================
+    !!                   ***  MODULE  traldf_iso  ***
+@@ -39,7 +42,17 @@
+    LOGICAL  ::   l_hst   ! flag to compute heat transport
+    !! * Substitutions
+-#  include "vectopt_loop_substitute.h90"
++   !!----------------------------------------------------------------------
++   !!                   ***  vectopt_loop_substitute  ***
++   !!----------------------------------------------------------------------
++   !! ** purpose :   substitute the inner loop start/end indices with CPP macro
++   !!                allow unrolling of do-loop (useful with vector processors)
++   !!----------------------------------------------------------------------
++   !!----------------------------------------------------------------------
++   !! NEMO/OCE 4.0 , NEMO Consortium (2018)
++   !! $Id: vectopt_loop_substitute.h90 10068 2018-08-28 14:09:04Z nicolasmartin $
++   !! Software governed by the CeCILL license (see ./LICENSE)
++   !!----------------------------------------------------------------------
+    !!----------------------------------------------------------------------
+    !! NEMO/OCE 4.0 , NEMO Consortium (2018)
+    !! $Id: traldf_iso.F90 10068 2018-08-28 14:09:04Z nicolasmartin $
+@@ -143,58 +156,42 @@
+       !
+       IF( kpass == 1 ) THEN                  !==  first pass only  ==!
+          !
+-         DO jk = 2, jpkm1
+-            DO jj = 2, jpjm1
+-               DO ji = fs_2, fs_jpim1   ! vector opt.
+-                  !
+-                  zmsku = wmask(ji,jj,jk) / MAX(   umask(ji  ,jj,jk-1) + umask(ji-1,jj,jk)          &
+-                     &                           + umask(ji-1,jj,jk-1) + umask(ji  ,jj,jk) , 1._wp  )
+-                  zmskv = wmask(ji,jj,jk) / MAX(   vmask(ji,jj  ,jk-1) + vmask(ji,jj-1,jk)          &
+-                     &                           + vmask(ji,jj-1,jk-1) + vmask(ji,jj  ,jk) , 1._wp  )
+-                     !
+-                  zahu_w = (   pahu(ji  ,jj,jk-1) + pahu(ji-1,jj,jk)    &
+-                     &       + pahu(ji-1,jj,jk-1) + pahu(ji  ,jj,jk)  ) * zmsku
+-                  zahv_w = (   pahv(ji,jj  ,jk-1) + pahv(ji,jj-1,jk)    &
+-                     &       + pahv(ji,jj-1,jk-1) + pahv(ji,jj  ,jk)  ) * zmskv
+-                     !
+-                  ah_wslp2(ji,jj,jk) = zahu_w * wslpi(ji,jj,jk) * wslpi(ji,jj,jk)   &
+-                     &               + zahv_w * wslpj(ji,jj,jk) * wslpj(ji,jj,jk)
+-               END DO
+-            END DO
+-         END DO
++         DO jk =  2,  jpkm1  ; DO jj = 2 ,jpjm1     ; DO ji = 2 ,jpim1
++            !
++            zmsku = wmask(ji,jj,jk) / MAX(   umask(ji  ,jj,jk-1) + umask(ji-1,jj,jk)          &
++               &                           + umask(ji-1,jj,jk-1) + umask(ji  ,jj,jk) , 1._wp  )
++            zmskv = wmask(ji,jj,jk) / MAX(   vmask(ji,jj  ,jk-1) + vmask(ji,jj-1,jk)          &
++               &                           + vmask(ji,jj-1,jk-1) + vmask(ji,jj  ,jk) , 1._wp  )
++               !
++            zahu_w = (   pahu(ji  ,jj,jk-1) + pahu(ji-1,jj,jk)    &
++               &       + pahu(ji-1,jj,jk-1) + pahu(ji  ,jj,jk)  ) * zmsku
++            zahv_w = (   pahv(ji,jj  ,jk-1) + pahv(ji,jj-1,jk)    &
++               &       + pahv(ji,jj-1,jk-1) + pahv(ji,jj  ,jk)  ) * zmskv
++               !
++            ah_wslp2(ji,jj,jk) = zahu_w * wslpi(ji,jj,jk) * wslpi(ji,jj,jk)   &
++               &               + zahv_w * wslpj(ji,jj,jk) * wslpj(ji,jj,jk)
++         END DO ; END DO ; END DO
+          !
+          IF( ln_traldf_msc ) THEN                ! stabilizing vertical diffusivity coefficient
+-            DO jk = 2, jpkm1
+-               DO jj = 2, jpjm1
+-                  DO ji = fs_2, fs_jpim1
+-                     akz(ji,jj,jk) = 0.25_wp * (                                                                     &
+-                        &              ( pahu(ji  ,jj,jk) + pahu(ji  ,jj,jk-1) ) / ( e1u(ji  ,jj) * e1u(ji  ,jj) )   &
+-                        &            + ( pahu(ji-1,jj,jk) + pahu(ji-1,jj,jk-1) ) / ( e1u(ji-1,jj) * e1u(ji-1,jj) )   &
+-                        &            + ( pahv(ji,jj  ,jk) + pahv(ji,jj  ,jk-1) ) / ( e2v(ji,jj  ) * e2v(ji,jj  ) )   &
+-                        &            + ( pahv(ji,jj-1,jk) + pahv(ji,jj-1,jk-1) ) / ( e2v(ji,jj-1) * e2v(ji,jj-1) )   )
+-                  END DO
+-               END DO
+-            END DO
++            DO jk =  2,  jpkm1  ; DO jj = 2 ,jpjm1     ; DO ji = 2 ,jpim1
++               akz(ji,jj,jk) = 0.25_wp * (                                                                     &
++                  &              ( pahu(ji  ,jj,jk) + pahu(ji  ,jj,jk-1) ) / ( e1u(ji  ,jj) * e1u(ji  ,jj) )   &
++                  &            + ( pahu(ji-1,jj,jk) + pahu(ji-1,jj,jk-1) ) / ( e1u(ji-1,jj) * e1u(ji-1,jj) )   &
++                  &            + ( pahv(ji,jj  ,jk) + pahv(ji,jj  ,jk-1) ) / ( e2v(ji,jj  ) * e2v(ji,jj  ) )   &
++                  &            + ( pahv(ji,jj-1,jk) + pahv(ji,jj-1,jk-1) ) / ( e2v(ji,jj-1) * e2v(ji,jj-1) )   )
++            END DO ; END DO ; END DO
+             !
+             IF( ln_traldf_blp ) THEN                ! bilaplacian operator
+-               DO jk = 2, jpkm1
+-                  DO jj = 1, jpjm1
+-                     DO ji = 1, fs_jpim1
+-                        akz(ji,jj,jk) = 16._wp * ah_wslp2(ji,jj,jk)   &
+-                           &          * (  akz(ji,jj,jk) + ah_wslp2(ji,jj,jk) / ( e3w_n(ji,jj,jk) * e3w_n(ji,jj,jk) )  )
+-                     END DO
+-                  END DO
+-               END DO
++               DO jk =  2,  jpkm1  ; DO jj = 2-1, jpjm1   ; DO ji = 2-1, jpim1
++                  akz(ji,jj,jk) = 16._wp * ah_wslp2(ji,jj,jk)   &
++                     &          * (  akz(ji,jj,jk) + ah_wslp2(ji,jj,jk) / ( e3w_n(ji,jj,jk) * e3w_n(ji,jj,jk) )  )
++               END DO ; END DO ; END DO
+             ELSEIF( ln_traldf_lap ) THEN              ! laplacian operator
+-               DO jk = 2, jpkm1
+-                  DO jj = 1, jpjm1
+-                     DO ji = 1, fs_jpim1
+-                        ze3w_2 = e3w_n(ji,jj,jk) * e3w_n(ji,jj,jk)
+-                        zcoef0 = z2dt * (  akz(ji,jj,jk) + ah_wslp2(ji,jj,jk) / ze3w_2  )
+-                        akz(ji,jj,jk) = MAX( zcoef0 - 0.5_wp , 0._wp ) * ze3w_2 * z1_2dt
+-                     END DO
+-                  END DO
+-               END DO
++               DO jk =  2,  jpkm1  ; DO jj = 2-1, jpjm1   ; DO ji = 2-1, jpim1
++                  ze3w_2 = e3w_n(ji,jj,jk) * e3w_n(ji,jj,jk)
++                  zcoef0 = z2dt * (  akz(ji,jj,jk) + ah_wslp2(ji,jj,jk) / ze3w_2  )
++                  akz(ji,jj,jk) = MAX( zcoef0 - 0.5_wp , 0._wp ) * ze3w_2 * z1_2dt
++               END DO ; END DO ; END DO
+            ENDIF
+            !
+          ELSE                                    ! 33 flux set to zero with akz=ah_wslp2 ==>> computed in full implicit
+@@ -215,28 +212,20 @@
+          !!end
+          ! Horizontal tracer gradient
+-         DO jk = 1, jpkm1
+-            DO jj = 1, jpjm1
+-               DO ji = 1, fs_jpim1   ! vector opt.
+-                  zdit(ji,jj,jk) = ( ptb(ji+1,jj  ,jk,jn) - ptb(ji,jj,jk,jn) ) * umask(ji,jj,jk)
+-                  zdjt(ji,jj,jk) = ( ptb(ji  ,jj+1,jk,jn) - ptb(ji,jj,jk,jn) ) * vmask(ji,jj,jk)
+-               END DO
+-            END DO
+-         END DO
++         DO jk =  1,  jpkm1  ; DO jj = 2-1, jpjm1   ; DO ji = 2-1, jpim1
++            zdit(ji,jj,jk) = ( ptb(ji+1,jj  ,jk,jn) - ptb(ji,jj,jk,jn) ) * umask(ji,jj,jk)
++            zdjt(ji,jj,jk) = ( ptb(ji  ,jj+1,jk,jn) - ptb(ji,jj,jk,jn) ) * vmask(ji,jj,jk)
++         END DO ; END DO ; END DO
+          IF( ln_zps ) THEN      ! botton and surface ocean correction of the horizontal gradient
+-            DO jj = 1, jpjm1              ! bottom correction (partial bottom cell)
+-               DO ji = 1, fs_jpim1   ! vector opt.
+-                  zdit(ji,jj,mbku(ji,jj)) = pgu(ji,jj,jn)
+-                  zdjt(ji,jj,mbkv(ji,jj)) = pgv(ji,jj,jn)
+-               END DO
+-            END DO
++            DO jj = 2-1, jpjm1   ; DO ji = 2-1, jpim1
++               zdit(ji,jj,mbku(ji,jj)) = pgu(ji,jj,jn)
++               zdjt(ji,jj,mbkv(ji,jj)) = pgv(ji,jj,jn)
++            END DO ; END DO
+             IF( ln_isfcav ) THEN      ! first wet level beneath a cavity
+-               DO jj = 1, jpjm1
+-                  DO ji = 1, fs_jpim1   ! vector opt.
+-                     IF( miku(ji,jj) > 1 )   zdit(ji,jj,miku(ji,jj)) = pgui(ji,jj,jn)
+-                     IF( mikv(ji,jj) > 1 )   zdjt(ji,jj,mikv(ji,jj)) = pgvi(ji,jj,jn)
+-                  END DO
+-               END DO
++               DO jj = 2-1, jpjm1   ; DO ji = 2-1, jpim1
++                  IF( miku(ji,jj) > 1 )   zdit(ji,jj,miku(ji,jj)) = pgui(ji,jj,jn)
++                  IF( mikv(ji,jj) > 1 )   zdjt(ji,jj,mikv(ji,jj)) = pgvi(ji,jj,jn)
++               END DO ; END DO
+             ENDIF
+          ENDIF
+          !
+@@ -252,36 +241,32 @@
+             IF( jk == 1 ) THEN   ;   zdkt(:,:) = zdk1t(:,:)                          ! surface: zdkt(jk=1)=zdkt(jk=2)
+             ELSE                 ;   zdkt(:,:) = ( ptb(:,:,jk-1,jn) - ptb(:,:,jk,jn) ) * wmask(:,:,jk)
+             ENDIF
+-            DO jj = 1 , jpjm1            !==  Horizontal fluxes
+-               DO ji = 1, fs_jpim1   ! vector opt.
+-                  zabe1 = pahu(ji,jj,jk) * e2_e1u(ji,jj) * e3u_n(ji,jj,jk)
+-                  zabe2 = pahv(ji,jj,jk) * e1_e2v(ji,jj) * e3v_n(ji,jj,jk)
+-                  !
+-                  zmsku = 1. / MAX(  wmask(ji+1,jj,jk  ) + wmask(ji,jj,jk+1)   &
+-                     &             + wmask(ji+1,jj,jk+1) + wmask(ji,jj,jk  ), 1. )
+-                  !
+-                  zmskv = 1. / MAX(  wmask(ji,jj+1,jk  ) + wmask(ji,jj,jk+1)   &
+-                     &             + wmask(ji,jj+1,jk+1) + wmask(ji,jj,jk  ), 1. )
+-                  !
+-                  zcof1 = - pahu(ji,jj,jk) * e2u(ji,jj) * uslp(ji,jj,jk) * zmsku
+-                  zcof2 = - pahv(ji,jj,jk) * e1v(ji,jj) * vslp(ji,jj,jk) * zmskv
+-                  !
+-                  zftu(ji,jj,jk ) = (  zabe1 * zdit(ji,jj,jk)   &
+-                     &               + zcof1 * (  zdkt (ji+1,jj) + zdk1t(ji,jj)      &
+-                     &                          + zdk1t(ji+1,jj) + zdkt (ji,jj)  )  ) * umask(ji,jj,jk)
+-                  zftv(ji,jj,jk) = (  zabe2 * zdjt(ji,jj,jk)   &
+-                     &               + zcof2 * (  zdkt (ji,jj+1) + zdk1t(ji,jj)      &
+-                     &                          + zdk1t(ji,jj+1) + zdkt (ji,jj)  )  ) * vmask(ji,jj,jk)
+-               END DO
+-            END DO
++            DO jj = 2-1, jpjm1   ; DO ji = 2-1, jpim1
++               zabe1 = pahu(ji,jj,jk) * e2_e1u(ji,jj) * e3u_n(ji,jj,jk)
++               zabe2 = pahv(ji,jj,jk) * e1_e2v(ji,jj) * e3v_n(ji,jj,jk)
++               !
++               zmsku = 1. / MAX(  wmask(ji+1,jj,jk  ) + wmask(ji,jj,jk+1)   &
++                  &             + wmask(ji+1,jj,jk+1) + wmask(ji,jj,jk  ), 1. )
++               !
++               zmskv = 1. / MAX(  wmask(ji,jj+1,jk  ) + wmask(ji,jj,jk+1)   &
++                  &             + wmask(ji,jj+1,jk+1) + wmask(ji,jj,jk  ), 1. )
++               !
++               zcof1 = - pahu(ji,jj,jk) * e2u(ji,jj) * uslp(ji,jj,jk) * zmsku
++               zcof2 = - pahv(ji,jj,jk) * e1v(ji,jj) * vslp(ji,jj,jk) * zmskv
++               !
++               zftu(ji,jj,jk ) = (  zabe1 * zdit(ji,jj,jk)   &
++                  &               + zcof1 * (  zdkt (ji+1,jj) + zdk1t(ji,jj)      &
++                  &                          + zdk1t(ji+1,jj) + zdkt (ji,jj)  )  ) * umask(ji,jj,jk)
++               zftv(ji,jj,jk) = (  zabe2 * zdjt(ji,jj,jk)   &
++                  &               + zcof2 * (  zdkt (ji,jj+1) + zdk1t(ji,jj)      &
++                  &                          + zdk1t(ji,jj+1) + zdkt (ji,jj)  )  ) * vmask(ji,jj,jk)
++            END DO ; END DO
+             !
+-            DO jj = 2 , jpjm1          !== horizontal divergence and add to pta
+-               DO ji = fs_2, fs_jpim1   ! vector opt.
+-                  pta(ji,jj,jk,jn) = pta(ji,jj,jk,jn) + zsign * (  zftu(ji,jj,jk) - zftu(ji-1,jj,jk)      &
+-                     &                                           + zftv(ji,jj,jk) - zftv(ji,jj-1,jk)  )   &
+-                     &                                        * r1_e1e2t(ji,jj) / e3t_n(ji,jj,jk)
+-               END DO
+-            END DO
++            DO jj = 2 ,jpjm1     ; DO ji = 2 ,jpim1
++               pta(ji,jj,jk,jn) = pta(ji,jj,jk,jn) + zsign * (  zftu(ji,jj,jk) - zftu(ji-1,jj,jk)      &
++                  &                                           + zftv(ji,jj,jk) - zftv(ji,jj-1,jk)  )   &
++                  &                                        * r1_e1e2t(ji,jj) / e3t_n(ji,jj,jk)
++            END DO ; END DO
+          END DO                                        !   End of slab
+          !!----------------------------------------------------------------------
+@@ -295,75 +280,55 @@
+          !                          ! Surface and bottom vertical fluxes set to zero
+          ztfw(:,:, 1 ) = 0._wp      ;      ztfw(:,:,jpk) = 0._wp
+-         DO jk = 2, jpkm1           ! interior (2=<jk=<jpk-1)
+-            DO jj = 2, jpjm1
+-               DO ji = fs_2, fs_jpim1   ! vector opt.
+-                  !
+-                  zmsku = wmask(ji,jj,jk) / MAX(   umask(ji  ,jj,jk-1) + umask(ji-1,jj,jk)          &
+-                     &                           + umask(ji-1,jj,jk-1) + umask(ji  ,jj,jk) , 1._wp  )
+-                  zmskv = wmask(ji,jj,jk) / MAX(   vmask(ji,jj  ,jk-1) + vmask(ji,jj-1,jk)          &
+-                     &                           + vmask(ji,jj-1,jk-1) + vmask(ji,jj  ,jk) , 1._wp  )
+-                     !
+-                  zahu_w = (   pahu(ji  ,jj,jk-1) + pahu(ji-1,jj,jk)    &
+-                     &       + pahu(ji-1,jj,jk-1) + pahu(ji  ,jj,jk)  ) * zmsku
+-                  zahv_w = (   pahv(ji,jj  ,jk-1) + pahv(ji,jj-1,jk)    &
+-                     &       + pahv(ji,jj-1,jk-1) + pahv(ji,jj  ,jk)  ) * zmskv
+-                     !
+-                  zcoef3 = - zahu_w * e2t(ji,jj) * zmsku * wslpi (ji,jj,jk)   !wslpi & j are already w-masked
+-                  zcoef4 = - zahv_w * e1t(ji,jj) * zmskv * wslpj (ji,jj,jk)
+-                  !
+-                  ztfw(ji,jj,jk) = zcoef3 * (   zdit(ji  ,jj  ,jk-1) + zdit(ji-1,jj  ,jk)      &
+-                     &                        + zdit(ji-1,jj  ,jk-1) + zdit(ji  ,jj  ,jk)  )   &
+-                     &           + zcoef4 * (   zdjt(ji  ,jj  ,jk-1) + zdjt(ji  ,jj-1,jk)      &
+-                     &                        + zdjt(ji  ,jj-1,jk-1) + zdjt(ji  ,jj  ,jk)  )
+-               END DO
+-            END DO
+-         END DO
++         DO jk =  2,  jpkm1  ; DO jj = 2 ,jpjm1     ; DO ji = 2 ,jpim1
++            !
++            zmsku = wmask(ji,jj,jk) / MAX(   umask(ji  ,jj,jk-1) + umask(ji-1,jj,jk)          &
++               &                           + umask(ji-1,jj,jk-1) + umask(ji  ,jj,jk) , 1._wp  )
++            zmskv = wmask(ji,jj,jk) / MAX(   vmask(ji,jj  ,jk-1) + vmask(ji,jj-1,jk)          &
++               &                           + vmask(ji,jj-1,jk-1) + vmask(ji,jj  ,jk) , 1._wp  )
++               !
++            zahu_w = (   pahu(ji  ,jj,jk-1) + pahu(ji-1,jj,jk)    &
++               &       + pahu(ji-1,jj,jk-1) + pahu(ji  ,jj,jk)  ) * zmsku
++            zahv_w = (   pahv(ji,jj  ,jk-1) + pahv(ji,jj-1,jk)    &
++               &       + pahv(ji,jj-1,jk-1) + pahv(ji,jj  ,jk)  ) * zmskv
++               !
++            zcoef3 = - zahu_w * e2t(ji,jj) * zmsku * wslpi (ji,jj,jk)   !wslpi & j are already w-masked
++            zcoef4 = - zahv_w * e1t(ji,jj) * zmskv * wslpj (ji,jj,jk)
++            !
++            ztfw(ji,jj,jk) = zcoef3 * (   zdit(ji  ,jj  ,jk-1) + zdit(ji-1,jj  ,jk)      &
++               &                        + zdit(ji-1,jj  ,jk-1) + zdit(ji  ,jj  ,jk)  )   &
++               &           + zcoef4 * (   zdjt(ji  ,jj  ,jk-1) + zdjt(ji  ,jj-1,jk)      &
++               &                        + zdjt(ji  ,jj-1,jk-1) + zdjt(ji  ,jj  ,jk)  )
++         END DO ; END DO ; END DO
+          !                                !==  add the vertical 33 flux  ==!
+          IF( ln_traldf_lap ) THEN               ! laplacian case: eddy coef = ah_wslp2 - akz
+-            DO jk = 2, jpkm1
+-               DO jj = 1, jpjm1
+-                  DO ji = fs_2, fs_jpim1
+-                     ztfw(ji,jj,jk) = ztfw(ji,jj,jk) + e1e2t(ji,jj) / e3w_n(ji,jj,jk) * wmask(ji,jj,jk)   &
+-                        &                            * ( ah_wslp2(ji,jj,jk) - akz(ji,jj,jk) )             &
+-                        &                            * ( ptb(ji,jj,jk-1,jn) - ptb(ji,jj,jk,jn) )
+-                  END DO
+-               END DO
+-            END DO
++            DO_3D_10_00( 2, jpkm1 )
++               ztfw(ji,jj,jk) = ztfw(ji,jj,jk) + e1e2t(ji,jj) / e3w_n(ji,jj,jk) * wmask(ji,jj,jk)   &
++                  &                            * ( ah_wslp2(ji,jj,jk) - akz(ji,jj,jk) )             &
++                  &                            * ( ptb(ji,jj,jk-1,jn) - ptb(ji,jj,jk,jn) )
++            END DO ; END DO ; END DO
+             !
+          ELSE                                   ! bilaplacian
+             SELECT CASE( kpass )
+             CASE(  1  )                            ! 1st pass : eddy coef = ah_wslp2
+-               DO jk = 2, jpkm1
+-                  DO jj = 1, jpjm1
+-                     DO ji = fs_2, fs_jpim1
+-                        ztfw(ji,jj,jk) = ztfw(ji,jj,jk)    &
+-                           &           + ah_wslp2(ji,jj,jk) * e1e2t(ji,jj)   &
+-                           &           * ( ptb(ji,jj,jk-1,jn) - ptb(ji,jj,jk,jn) ) / e3w_n(ji,jj,jk) * wmask(ji,jj,jk)
+-                     END DO
+-                  END DO
+-               END DO
++               DO_3D_10_00( 2, jpkm1 )
++                  ztfw(ji,jj,jk) = ztfw(ji,jj,jk)    &
++                     &           + ah_wslp2(ji,jj,jk) * e1e2t(ji,jj)   &
++                     &           * ( ptb(ji,jj,jk-1,jn) - ptb(ji,jj,jk,jn) ) / e3w_n(ji,jj,jk) * wmask(ji,jj,jk)
++               END DO ; END DO ; END DO
+             CASE(  2  )                         ! 2nd pass : eddy flux = ah_wslp2 and akz applied on ptb  and ptbb gradients, resp.
+-               DO jk = 2, jpkm1
+-                  DO jj = 1, jpjm1
+-                     DO ji = fs_2, fs_jpim1
+-                        ztfw(ji,jj,jk) = ztfw(ji,jj,jk) + e1e2t(ji,jj) / e3w_n(ji,jj,jk) * wmask(ji,jj,jk)                      &
+-                           &                            * (  ah_wslp2(ji,jj,jk) * ( ptb (ji,jj,jk-1,jn) - ptb (ji,jj,jk,jn) )   &
+-                           &                               + akz     (ji,jj,jk) * ( ptbb(ji,jj,jk-1,jn) - ptbb(ji,jj,jk,jn) )   )
+-                     END DO
+-                  END DO
+-               END DO
++               DO_3D_10_00( 2, jpkm1 )
++                  ztfw(ji,jj,jk) = ztfw(ji,jj,jk) + e1e2t(ji,jj) / e3w_n(ji,jj,jk) * wmask(ji,jj,jk)                      &
++                     &                            * (  ah_wslp2(ji,jj,jk) * ( ptb (ji,jj,jk-1,jn) - ptb (ji,jj,jk,jn) )   &
++                     &                               + akz     (ji,jj,jk) * ( ptbb(ji,jj,jk-1,jn) - ptbb(ji,jj,jk,jn) )   )
++               END DO ; END DO ; END DO
+             END SELECT
+          ENDIF
+          !
+-         DO jk = 1, jpkm1                 !==  Divergence of vertical fluxes added to pta  ==!
+-            DO jj = 2, jpjm1
+-               DO ji = fs_2, fs_jpim1   ! vector opt.
+-                  pta(ji,jj,jk,jn) = pta(ji,jj,jk,jn) + zsign * (  ztfw (ji,jj,jk) - ztfw(ji,jj,jk+1)  )   &
+-                     &                                        * r1_e1e2t(ji,jj) / e3t_n(ji,jj,jk)
+-               END DO
+-            END DO
+-         END DO
++         DO jk =  1,  jpkm1  ; DO jj = 2 ,jpjm1     ; DO ji = 2 ,jpim1
++            pta(ji,jj,jk,jn) = pta(ji,jj,jk,jn) + zsign * (  ztfw (ji,jj,jk) - ztfw(ji,jj,jk+1)  )   &
++               &                                        * r1_e1e2t(ji,jj) / e3t_n(ji,jj,jk)
++         END DO ; END DO ; END DO
+          !
+          IF( ( kpass == 1 .AND. ln_traldf_lap ) .OR.  &     !==  first pass only (  laplacian)  ==!
+              ( kpass == 2 .AND. ln_traldf_blp ) ) THEN      !==  2nd   pass      (bilaplacian)  ==!
+}}}