New URL for NEMO forge! http://forge.nemo-ocean.eu

Since March 2022 along with NEMO 4.2 release, the code development moved to a self-hosted GitLab.
This present forge is now archived and remained online for history.

2019WP/KERNEL-02_Storkey_Coward_IMMERSE_first_steps (diff) – NEMO

Context Navigation

Changes between Version 11 and Version 12 of 2019WP/KERNEL-02_Storkey_Coward_IMMERSE_first_steps

Timestamp:: 2019-03-01T15:45:10+01:00 (5 years ago)
Author:: acc
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

2019WP/KERNEL-02_Storkey_Coward_IMMERSE_first_steps

-                      v11
+                      v12
 So far so good....
+'''Automating the tiling changes'''
+== Automating the tiling changes
 Here is a first attempt at automating the loop changes. Just for the 2D loops so far but it shows the possibilities. For now, I've assumed we don't need all the explicit DO_2D_00_01 type macros but just go for a generic version with arguments. This was proposed for the 3D version so why not for the 2D cases?. TBD. Firstly here is the annotated perl script:
 {{{
+cat do2dfinder.pl
+#
 open(F,$ARGV[0]) || die "Cannot open $ARGV[0]: $!";
 …
        END DO                                           !   End of slab
        !                                                ! ===============
+@@ -365,43 +347,33 @@
+          CASE ( np_COR )                           !* Coriolis (planetary vorticity)
+             zwz(:,:) = ff_f(:,:)
+          CASE ( np_RVO )                           !* relative vorticity
+-            DO jj = 1, jpjm1
+-               DO ji = 1, fs_jpim1   ! vector opt.
+-                  zwz(ji,jj) = (  e2v(ji+1,jj  ) * pvn(ji+1,jj  ,jk) - e2v(ji,jj) * pvn(ji,jj,jk)    &
+-                     &          - e1u(ji  ,jj+1) * pun(ji  ,jj+1,jk) + e1u(ji,jj) * pun(ji,jj,jk)  ) * r1_e1e2f(ji,jj)
+-               END DO
+}}}
+''' Extending for the 3D loops '''
+Dealing with the 2D loops can be considered as the first stage of converting suitable 3D loops. In the simplest cases a small variation of the do2dfinder.pl perl script which subsequently looks for consecutive `DO jk =` `DO_2D` statements instead of `DO jj`-`DO ji` pairs should work. However, finding such consecutive statements, in the 3D case, is a much less certain indication of a valid loop to process. Take, for example, this snippet of `dynadv_cen2.F90` which has been processed for 2D loops:
+{{{
+      DO jk = 2, jpkm1                    ! interior advective fluxes
+         DO_2D( 2, jpi , 2, jpj )
+            zfw(ji,jj,jk) = 0.25_wp * e1e2t(ji,jj) * wn(ji,jj,jk)
+         END_2D
+         DO_2D( fs_2, fs_jpim1 , 2, jpjm1 )
+            zfu_uw(ji,jj,jk) = ( zfw(ji,jj,jk) + zfw(ji+1,jj  ,jk) ) * ( un(ji,jj,jk) + un(ji,jj,jk-1) )
+            zfv_vw(ji,jj,jk) = ( zfw(ji,jj,jk) + zfw(ji  ,jj+1,jk) ) * ( vn(ji,jj,jk) + vn(ji,jj,jk-1) )
+         END_2D
+      END DO
+      DO jk = 1, jpkm1                    ! divergence of vertical momentum flux divergence
+         DO_2D( fs_2, fs_jpim1 , 2, jpjm1 )
+            ua(ji,jj,jk) = ua(ji,jj,jk) - ( zfu_uw(ji,jj,jk) - zfu_uw(ji,jj,jk+1) ) * r1_e1e2u(ji,jj) / e3u_n(ji,jj,jk)
+            va(ji,jj,jk) = va(ji,jj,jk) - ( zfv_vw(ji,jj,jk) - zfv_vw(ji,jj,jk+1) ) * r1_e1e2v(ji,jj) / e3v_n(ji,jj,jk)
+         END_2D
+      END DO
+}}}
+Only the second 3D loop can be collapsed to a single construct. Unfortunately, this decision can't be made until the end of the loop is reached so a modification is required that allows two versions of a loop to be mantained in memory and the appropriate set written out on decision. The IO:stringy perl package provides the ideal tools by allowing string variables to be treated like files. Here is the modified script that will apply the 2nd stage conversion of 3D loops were possible:
+{{{
+cat do3dfinder.pl
+#
+use IO::Scalar;
+open(F,$ARGV[0]) || die "Cannot open $ARGV[0]: $!";
+while(<F>) {
+   if ( $_ =~ /^\s*DO\s* jk/i) {
+      # Start processing loop if line contains DO jk (case and whitespace independent)
+      #
+      # 1. Store the current line
+      #
+      $jline = $_;
+      #
+      # 2. Read the next line and check if it contains DO_2D
+      #
+      my $iline = <F> || die "DO jk line at end of file?";
+      if ( $iline =~ /^\s*DO_2D\s*\(/i) {
+         my $isinavlid = 0;
+         #
+         # 3. Initialise a count to track any nested do loops
+         #
+         my $docount = 0;
+         #
+         # 4. Store the loop limits from the two lines stored and remove spaces and new-lines
+         #
+         ($jargs = $jline) =~ s/(^.*)=([^\!\n]*)(\!*.*)/\2/;
+         ($iargs = $iline) =~ s/(^.*)\(([^\!\n]*)\)(\!*.*)/\2/;
+         chomp($iargs);
+         chomp($jargs);
+         $iargs =~ s/^\s+//; $iargs =~ s/\s+$//;
+         $jargs =~ s/^\s+//; $jargs =~ s/\s+$//;
+         #
+         # 5. Store the leading indentation for the outer loop
+         #
+         ($jspac = $jline) =~ s/(^[\s]*)([^\s]*).*/\1/;
+         chomp($jspac);
+         #
+         # 6. Construct a DO_3D line to replace the original statements
+         #
+         # Keep two versions of output until we know if it is transformable
+         #
+         my $ostr = "";
+         my $astr = "";
+         my $orig = new IO::Scalar \$ostr;
+         print $orig $jline;
+         print $orig $iline;
+         my $altr = new IO::Scalar \$astr;
+         print $altr $jspac,"DO_3D( ",$iargs," , ",$jargs," )\n";
+         #
+         # 7. Now process the loop contents until the matching  END_2D statement
+         #
+         while ( $docount >= 0 || ! ( $iline =~ /^\s*END_2D/i ) ) {
+            $iline = <F> || eval{ $isinvalid = 1 };
+            #print $orig $iline;
+            #
+            # 8. Increment a counter if another DO_2D statement is found
+            #
+            if ( $iline =~ /^\s*do_2d/i )  { $docount++ };
+            #
+            # 9. Decrement a counter if a END DO statement is found
+            #
+            if ( $iline =~ /^\s*end_2d/i )  { $docount-- };
+            #
+            # 10. A negative counter means the matching END_2D for the ji loop has been reached
+            #
+            if ( $docount < 0 ) {
+               #
+               # 11. Check the next line is the expected END DO for the jk loop.
+               #     Output END_3D statement if it is
+               #
+               $jline = <F> || eval {$isinvalid = 1} ;
+               if ( ! ($jline =~ /^\s*end\s*do/i) )  {
+                  $isinvalid = 1 ;
+                  print $orig $iline;
+                  print $orig $jline;
+               } else {
+                  print $altr $jspac,"END_3D\n";
+               }
+               if ( $isinvalid == 0 ) {
+                  print $altr;
+               } else {
+                  print $orig;
+                  $isinvalid = 0;
+               }
+            } else {
+               #
+               # 12. This is a line inside the loop. Remove three leading spaces (if any) and output.
+               #
+               print $orig $iline;
+               $iline =~ s/^\s\s\s//;
+               print $altr $iline;
+            }
+         }
+      } else {
+         #
+         # 13. Consecutive DO statements were not found. Do not process these loops.
+         #
+         print $jline;
+         print $iline;
+      }
+   } else {
+      #
+      # 14. Code outside of a DO construct. Leave unchanged.
+      #
+      print $_;
+   }
+}
+}}}
+These scripts can be run sequentially; for example:
+{{{
+  cp TEST_FILES_ORG/dynadv_cen2.F90 TESTDO_FILES/
+  perl do2dfinder.pl TESTDO_FILES/dynadv_cen2.F90 > TESTDO_FILES_2D/dynadv_cen2.F90
+  perl do3dfinder.pl TESTDO_FILES_2D/dynadv_cen2.F90 > TESTDO_FILES_3D/dynadv_cen2.F90
+}}}
+And the difference between the original and final version is:
+{{{#!diff
+--- TESTDO_FILES/dynadv_cen2.F90        2019-03-01 13:35:29.000000000 +0000
++++ TESTDO_FILES_3D/dynadv_cen2.F90     2019-03-01 13:40:02.000000000 +0000
+@@ -68,22 +68,18 @@
+       DO jk = 1, jpkm1                    ! horizontal transport
+          zfu(:,:,jk) = 0.25_wp * e2u(:,:) * e3u_n(:,:,jk) * un(:,:,jk)
+          zfv(:,:,jk) = 0.25_wp * e1v(:,:) * e3v_n(:,:,jk) * vn(:,:,jk)
+-         DO jj = 1, jpjm1                 ! horizontal momentum fluxes (at T- and F-point)
+-            DO ji = 1, fs_jpim1   ! vector opt.
+-               zfu_t(ji+1,jj  ,jk) = ( zfu(ji,jj,jk) + zfu(ji+1,jj,jk) ) * ( un(ji,jj,jk) + un(ji+1,jj  ,jk) )
+-               zfv_f(ji  ,jj  ,jk) = ( zfv(ji,jj,jk) + zfv(ji+1,jj,jk) ) * ( un(ji,jj,jk) + un(ji  ,jj+1,jk) )
+-               zfu_f(ji  ,jj  ,jk) = ( zfu(ji,jj,jk) + zfu(ji,jj+1,jk) ) * ( vn(ji,jj,jk) + vn(ji+1,jj  ,jk) )
+-               zfv_t(ji  ,jj+1,jk) = ( zfv(ji,jj,jk) + zfv(ji,jj+1,jk) ) * ( vn(ji,jj,jk) + vn(ji  ,jj+1,jk) )
 -            END DO
++            DO_2D( 1, fs_jpim1 , 1, jpjm1 )
++               zwz(ji,jj) = (  e2v(ji+1,jj  ) * pvn(ji+1,jj  ,jk) - e2v(ji,jj) * pvn(ji,jj,jk)    &
++                  &          - e1u(ji  ,jj+1) * pun(ji  ,jj+1,jk) + e1u(ji,jj) * pun(ji,jj,jk)  ) * r1_e1e2f(ji,jj)
++            END_2D
+          CASE ( np_MET )                           !* metric term
+-            DO jj = 1, jpjm1
+-               DO ji = 1, fs_jpim1   ! vector opt.
+-                  zwz(ji,jj) = ( pvn(ji+1,jj  ,jk) + pvn(ji,jj,jk) ) * di_e2v_2e1e2f(ji,jj)   &
+-                     &       - ( pun(ji  ,jj+1,jk) + pun(ji,jj,jk) ) * dj_e1u_2e1e2f(ji,jj)
+-               END DO
+-         END DO
+-         DO jj = 2, jpjm1                 ! divergence of horizontal momentum fluxes
+-            DO ji = fs_2, fs_jpim1   ! vector opt.
+-               ua(ji,jj,jk) = ua(ji,jj,jk) - (  zfu_t(ji+1,jj,jk) - zfu_t(ji,jj  ,jk)    &
+-                  &                           + zfv_f(ji  ,jj,jk) - zfv_f(ji,jj-1,jk)  ) * r1_e1e2u(ji,jj) / e3u_n(ji,jj,jk)
+-               va(ji,jj,jk) = va(ji,jj,jk) - (  zfu_f(ji,jj  ,jk) - zfu_f(ji-1,jj,jk)    &
+-                  &                           + zfv_t(ji,jj+1,jk) - zfv_t(ji  ,jj,jk)  ) * r1_e1e2v(ji,jj) / e3v_n(ji,jj,jk)
 -            END DO
++            DO_2D( 1, fs_jpim1 , 1, jpjm1 )
++               zwz(ji,jj) = ( pvn(ji+1,jj  ,jk) + pvn(ji,jj,jk) ) * di_e2v_2e1e2f(ji,jj)   &
++                  &       - ( pun(ji  ,jj+1,jk) + pun(ji,jj,jk) ) * dj_e1u_2e1e2f(ji,jj)
++            END_2D
+          CASE ( np_CRV )                           !* Coriolis + relative vorticity
+-            DO jj = 1, jpjm1
+-               DO ji = 1, fs_jpim1   ! vector opt.
+-                  zwz(ji,jj) = ff_f(ji,jj) + (  e2v(ji+1,jj) * pvn(ji+1,jj,jk) - e2v(ji,jj) * pvn(ji,jj,jk)      &
+-                     &                        - e1u(ji,jj+1) * pun(ji,jj+1,jk) + e1u(ji,jj) * pun(ji,jj,jk)  ) * r1_e1e2f(ji,jj)
+-               END DO
+-            END DO
++            DO_2D( 1, fs_jpim1 , 1, jpjm1 )
++               zwz(ji,jj) = ff_f(ji,jj) + (  e2v(ji+1,jj) * pvn(ji+1,jj,jk) - e2v(ji,jj) * pvn(ji,jj,jk)      &
++                  &                        - e1u(ji,jj+1) * pun(ji,jj+1,jk) + e1u(ji,jj) * pun(ji,jj,jk)  ) * r1_e1e2f(ji,jj)
++            END_2D
+          CASE ( np_CME )                           !* Coriolis + metric
+-            DO jj = 1, jpjm1
+-               DO ji = 1, fs_jpim1   ! vector opt.
+-                  zwz(ji,jj) = ff_f(ji,jj) + ( pvn(ji+1,jj  ,jk) + pvn(ji,jj,jk) ) * di_e2v_2e1e2f(ji,jj)   &
+-                     &                     - ( pun(ji  ,jj+1,jk) + pun(ji,jj,jk) ) * dj_e1u_2e1e2f(ji,jj)
+-               END DO
+-            END DO
++            DO_2D( 1, fs_jpim1 , 1, jpjm1 )
++               zwz(ji,jj) = ff_f(ji,jj) + ( pvn(ji+1,jj  ,jk) + pvn(ji,jj,jk) ) * di_e2v_2e1e2f(ji,jj)   &
++                  &                     - ( pun(ji  ,jj+1,jk) + pun(ji,jj,jk) ) * dj_e1u_2e1e2f(ji,jj)
++            END_2D
+          CASE DEFAULT                                             ! error
+             CALL ctl_stop('STOP','dyn_vor: wrong value for kvor'  )
+          END SELECT
+          !
+          IF( ln_dynvor_msk ) THEN          !==  mask/unmask vorticity ==!
+-            DO jj = 1, jpjm1
+-               DO ji = 1, fs_jpim1   ! vector opt.
+-                  zwz(ji,jj) = zwz(ji,jj) * fmask(ji,jj,jk)
+-               END DO
+-            END DO
++            DO_2D( 1, fs_jpim1 , 1, jpjm1 )
++               zwz(ji,jj) = zwz(ji,jj) * fmask(ji,jj,jk)
++            END_2D
+          ENDIF
+          IF( ln_sco ) THEN
+@@ -413,16 +385,14 @@
+             zwy(:,:) = e1v(:,:) * pvn(:,:,jk)
+          ENDIF
+          !                                   !==  compute and add the vorticity term trend  =!
+-         END DO
++         DO_2D( 1, fs_jpim1 , 1, jpjm1 )
++            zfu_t(ji+1,jj  ,jk) = ( zfu(ji,jj,jk) + zfu(ji+1,jj,jk) ) * ( un(ji,jj,jk) + un(ji+1,jj  ,jk) )
++            zfv_f(ji  ,jj  ,jk) = ( zfv(ji,jj,jk) + zfv(ji+1,jj,jk) ) * ( un(ji,jj,jk) + un(ji  ,jj+1,jk) )
++            zfu_f(ji  ,jj  ,jk) = ( zfu(ji,jj,jk) + zfu(ji,jj+1,jk) ) * ( vn(ji,jj,jk) + vn(ji+1,jj  ,jk) )
++            zfv_t(ji  ,jj+1,jk) = ( zfv(ji,jj,jk) + zfv(ji,jj+1,jk) ) * ( vn(ji,jj,jk) + vn(ji  ,jj+1,jk) )
++         END_2D
++         DO_2D( fs_2, fs_jpim1 , 2, jpjm1 )
++            ua(ji,jj,jk) = ua(ji,jj,jk) - (  zfu_t(ji+1,jj,jk) - zfu_t(ji,jj  ,jk)    &
++               &                           + zfv_f(ji  ,jj,jk) - zfv_f(ji,jj-1,jk)  ) * r1_e1e2u(ji,jj) / e3u_n(ji,jj,jk)
++            va(ji,jj,jk) = va(ji,jj,jk) - (  zfu_f(ji,jj  ,jk) - zfu_f(ji-1,jj,jk)    &
++               &                           + zfv_t(ji,jj+1,jk) - zfv_t(ji  ,jj,jk)  ) * r1_e1e2v(ji,jj) / e3v_n(ji,jj,jk)
++         END_2D
+       END DO
+       !
+       IF( l_trddyn ) THEN           ! trends: send trend to trddyn for diagnostic
+@@ -96,41 +92,29 @@
+       !
+       !                             !==  Vertical advection  ==!
+       !
+-      DO jj = 2, jpjm1                    ! surface/bottom advective fluxes set to zero
+-         DO ji = fs_2, fs_jpim1
+-            zfu_uw(ji,jj,jpk) = 0._wp   ;   zfv_vw(ji,jj,jpk) = 0._wp
+-            zfu_uw(ji,jj, 1 ) = 0._wp   ;   zfv_vw(ji,jj, 1 ) = 0._wp
+-         END DO
+-      END DO
++      DO_2D( fs_2, fs_jpim1 , 2, jpjm1 )
++         zfu_uw(ji,jj,jpk) = 0._wp   ;   zfv_vw(ji,jj,jpk) = 0._wp
++         zfu_uw(ji,jj, 1 ) = 0._wp   ;   zfv_vw(ji,jj, 1 ) = 0._wp
++      END_2D
+       IF( ln_linssh ) THEN                ! linear free surface: advection through the surface
 -         DO jj = 2, jpjm1
+-            DO ji = fs_2, fs_jpim1   ! vector opt.
+-               zy1 = zwy(ji,jj-1) + zwy(ji+1,jj-1)
+-               zy2 = zwy(ji,jj  ) + zwy(ji+1,jj  )
+-               zx1 = zwx(ji-1,jj) + zwx(ji-1,jj+1)
+-               zx2 = zwx(ji  ,jj) + zwx(ji  ,jj+1)
+-               pua(ji,jj,jk) = pua(ji,jj,jk) + r1_4 * r1_e1u(ji,jj) * ( zwz(ji  ,jj-1) * zy1 + zwz(ji,jj) * zy2 )
+-               pva(ji,jj,jk) = pva(ji,jj,jk) - r1_4 * r1_e2v(ji,jj) * ( zwz(ji-1,jj  ) * zx1 + zwz(ji,jj) * zx2 )
+-            DO ji = fs_2, fs_jpim1
+-               zfu_uw(ji,jj,1) = 0.5_wp * ( e1e2t(ji,jj) * wn(ji,jj,1) + e1e2t(ji+1,jj) * wn(ji+1,jj,1) ) * un(ji,jj,1)
+-               zfv_vw(ji,jj,1) = 0.5_wp * ( e1e2t(ji,jj) * wn(ji,jj,1) + e1e2t(ji,jj+1) * wn(ji,jj+1,1) ) * vn(ji,jj,1)
 -            END DO
 -         END DO
 +         DO_2D( fs_2, fs_jpim1 , 2, jpjm1 )
++            zy1 = zwy(ji,jj-1) + zwy(ji+1,jj-1)
++            zy2 = zwy(ji,jj  ) + zwy(ji+1,jj  )
++            zx1 = zwx(ji-1,jj) + zwx(ji-1,jj+1)
++            zx2 = zwx(ji  ,jj) + zwx(ji  ,jj+1)
++            pua(ji,jj,jk) = pua(ji,jj,jk) + r1_4 * r1_e1u(ji,jj) * ( zwz(ji  ,jj-1) * zy1 + zwz(ji,jj) * zy2 )
++            pva(ji,jj,jk) = pva(ji,jj,jk) - r1_4 * r1_e2v(ji,jj) * ( zwz(ji-1,jj  ) * zx1 + zwz(ji,jj) * zx2 )
++            zfu_uw(ji,jj,1) = 0.5_wp * ( e1e2t(ji,jj) * wn(ji,jj,1) + e1e2t(ji+1,jj) * wn(ji+1,jj,1) ) * un(ji,jj,1)
++            zfv_vw(ji,jj,1) = 0.5_wp * ( e1e2t(ji,jj) * wn(ji,jj,1) + e1e2t(ji,jj+1) * wn(ji,jj+1,1) ) * vn(ji,jj,1)
 +         END_2D
+          !                                             ! ===============
+       END DO                                           !   End of slab
+       !                                                ! ===============
+}}}
+       ENDIF
+       DO jk = 2, jpkm1                    ! interior advective fluxes
+-         DO jj = 2, jpj                       ! 1/4 * Vertical transport
+-            DO ji = 2, jpi
+-               zfw(ji,jj,jk) = 0.25_wp * e1e2t(ji,jj) * wn(ji,jj,jk)
+-            END DO
+-         END DO
+-         DO jj = 2, jpjm1
+-            DO ji = fs_2, fs_jpim1   ! vector opt.
+-               zfu_uw(ji,jj,jk) = ( zfw(ji,jj,jk) + zfw(ji+1,jj  ,jk) ) * ( un(ji,jj,jk) + un(ji,jj,jk-1) )
+-               zfv_vw(ji,jj,jk) = ( zfw(ji,jj,jk) + zfw(ji  ,jj+1,jk) ) * ( vn(ji,jj,jk) + vn(ji,jj,jk-1) )
+-            END DO
+-         END DO
+-      END DO
+-      DO jk = 1, jpkm1                    ! divergence of vertical momentum flux divergence
+-         DO jj = 2, jpjm1
+-            DO ji = fs_2, fs_jpim1   ! vector opt.
+-               ua(ji,jj,jk) = ua(ji,jj,jk) - ( zfu_uw(ji,jj,jk) - zfu_uw(ji,jj,jk+1) ) * r1_e1e2u(ji,jj) / e3u_n(ji,jj,jk)
+-               va(ji,jj,jk) = va(ji,jj,jk) - ( zfv_vw(ji,jj,jk) - zfv_vw(ji,jj,jk+1) ) * r1_e1e2v(ji,jj) / e3v_n(ji,jj,jk)
+-            END DO
+-         END DO
++         DO_2D( 2, jpi , 2, jpj )
++            zfw(ji,jj,jk) = 0.25_wp * e1e2t(ji,jj) * wn(ji,jj,jk)
++         END_2D
++         DO_2D( fs_2, fs_jpim1 , 2, jpjm1 )
++            zfu_uw(ji,jj,jk) = ( zfw(ji,jj,jk) + zfw(ji+1,jj  ,jk) ) * ( un(ji,jj,jk) + un(ji,jj,jk-1) )
++            zfv_vw(ji,jj,jk) = ( zfw(ji,jj,jk) + zfw(ji  ,jj+1,jk) ) * ( vn(ji,jj,jk) + vn(ji,jj,jk-1) )
++         END_2D
+       END DO
++      DO_3D( fs_2, fs_jpim1 , 2, jpjm1 , 1, jpkm1 )
++         ua(ji,jj,jk) = ua(ji,jj,jk) - ( zfu_uw(ji,jj,jk) - zfu_uw(ji,jj,jk+1) ) * r1_e1e2u(ji,jj) / e3u_n(ji,jj,jk)
++         va(ji,jj,jk) = va(ji,jj,jk) - ( zfv_vw(ji,jj,jk) - zfv_vw(ji,jj,jk+1) ) * r1_e1e2v(ji,jj) / e3v_n(ji,jj,jk)
++      END_3D
+       !
+       IF( l_trddyn ) THEN                 ! trends: send trend to trddyn for diagnostic
+          zfu_t(:,:,:) = ua(:,:,:) - zfu_t(:,:,:)
+}}}